记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务
3523
马斯克宣布已激活了「星链」卫星通信系统,该系统现已在伊朗投入使用,这将对伊朗的互联网监管带来哪些影响?

2025-06-18 查看(1000)

6月14日老马针对Starlink在伊朗的卫星互联网服务回应
3523
如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?

2025-06-17 查看(1000)

首先谷歌的 llm diffusion 和之前发布的 llm
3523
传北京多所高校禁用罗马仕充电宝,罗马仕称交由法务部门进行跟进,这到底是怎么回事?

2025-06-18 查看(1000)

罗马仕充电宝早在 2019年就因为爆炸上过热搜:如何看待南开
3523
5499元的iPhone16Pro 16号晚 8 点开抢,苹果耳机也能用88VIP券了,有哪些攻略?

2025-06-17 查看(1000)

作为一名忠实果粉,这次的活动真的太令人激动了啊!5000多的
3523
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-17 查看(1000)

虽说如今新大模型发布必须有点拿得出手的干货,但MiniMax