记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!
-
- qwen3-0.6B这种小模型有什么实际意义和用途吗?
- 0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
2025-06-17 查看(1000)
-
- 马斯克宣布已激活了「星链」卫星通信系统,该系统现已在伊朗投入使用,这将对伊朗的互联网监管带来哪些影响?
- 6月14日老马针对Starlink在伊朗的卫星互联网服务回应
2025-06-18 查看(1000)
-
- 如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?
- 首先谷歌的 llm diffusion 和之前发布的 llm
2025-06-17 查看(1000)
-
- 传北京多所高校禁用罗马仕充电宝,罗马仕称交由法务部门进行跟进,这到底是怎么回事?
- 罗马仕充电宝早在 2019年就因为爆炸上过热搜:如何看待南开
2025-06-18 查看(1000)
-
- 5499元的iPhone16Pro 16号晚 8 点开抢,苹果耳机也能用88VIP券了,有哪些攻略?
- 作为一名忠实果粉,这次的活动真的太令人激动了啊!5000多的
2025-06-17 查看(1000)
-
- 如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
- 虽说如今新大模型发布必须有点拿得出手的干货,但MiniMax
2025-06-17 查看(1000)