DeepSeek本地部署测试

您挺难伺候的。:cool:
看来坛子里不能指出逻辑漏洞啊

他说人家开源
同样的“开源模型”很多,最大的就是llama
但其实都是model weights,training data都保密

他又开始吹核心技术
学来个词就瞎掰
 
这是人家的核心技术。
“The release of DeepSeek-R1 is an amazing boon for the community, but they didn’t release everything—although the model weights are open, the datasets and code used to train the model are not 😢.” huggingface上有Open-R1项目,要深挖没有公开的部分 :D
 
各有千秋,DS没那么神
DS <think>这个block太愚蠢了,无法去掉思维step

这里你说它没那么神,但是人家不开源核心技术,感觉你抓瞎了。你自己能不能搞一个替代品,然后彻底开源?
 
主页没用也不支持手机所以取消了, 你需要主页的哪个功能?
多谢回复!其实我没有什么特别的要求,只是看到CFC的首页不能正常更新,有些不爽,挺好的网页,十多年了一直陪伴着我,譬如我在首页的广告中买过床垫,查询天气预报和计算贷款利率飞机航班信息等。
 
这里你说它没那么神,但是人家不开源核心技术,感觉你抓瞎了。你自己能不能搞一个替代品,然后彻底开源?
这是两码事,你居然能把用一个东西和开发一个东西混为一谈
开源就是开源,不是“开源这里不开源那里”。你上来吹开源,然后自己打脸又说开始说核心技术
从inference能力的角度他就是没那么神,你自己把几个llm都架起来自己试试就知道了,光道听途说没用的

他的核心技术要是后面推手很牛逼吹得神我倒是信
说training cost低有待证实,没证据之前都是瞎掰
 
后退
顶部