有没有人用过deepseek_v3? Zuckerberg 都怕了

禁止AI芯片卖中国,制裁了几千家中国公司。
美国政府已经很帮忙了。
美国政府如此帮忙,小扎还是混得不好,他自身能力有问题。
 
美国政府如此帮忙,小扎还是混得不好,他自身能力有问题。
他已经得了很多利益了,就两年时间股票涨了近6倍,还不是因为美国政府天天折腾TikTok的原因
 
他已经得了很多利益了,就两年时间股票涨了近6倍,还不是因为美国政府天天折腾TikTok的原因
他的埋汰已经不行了,被TIKTOK远远抛于脑后。现在谁还投资埋汰哈。
 
When I hear that China has caught up, I am skeptical. When I hear you mention copy, steal or democracy, I know we're been surpassed.


I love how they are talking "Democratic AI" and "authoritarian AI". Can "Democratic AI" criticize Israel?
是真有水平,还是一个joke, 需要时间的检验和证明。

一个藤校的学霸,花巨资和巨量的时间做出来的世界级最先进的工具,被一个不入流的二流凡人用极其短的时间,花极少的钱超越了。

按正常的思维,和有电脑工程师工作经验的正常人判断,得到的结论就是不可能。

CFC 上有你们这些一点就着,不做自己的分析和判断,就欢呼雀跃的人充斥,真是low 得可以。

Shame on you!
 
是真有水平,还是一个joke, 需要时间的检验和证明。

一个藤校的学霸,花巨资和巨量的时间做出来的世界级最先进的工具,被一个不入流的二流凡人用极其短的时间,花极少的钱超越了。

按正常的思维,和有电脑工程师工作经验的正常人判断,得到的结论就是不可能。

CFC 上有你们这些一点就着,不做自己的分析和判断,就欢呼雀跃的人充斥,真是low 得可以。

Shame on you!


不是极短时间。他们研究10多年了。
 
你对中国人有固有的成见。
你听听扎克伯格怎么说的。


View: https://youtube.com/shorts/hG4tGl0s7XU?si=JF3-ZUBAe_SKQTxQ

我对中国人没有成见,我很希望中国人花时间和巨资做点什么世界领先的工具,让其他国家的人迅速超越。
这样我会觉得中国人是真有本事,那些用短时间快速超越的人是水货。

另外,只根据一个人说话,就下结论,就来反驳他人的看法,这是你做事的风格吗?
 
DEEPSEEK 确实有突破性的超越,主要在训练方法,最近几年RL 被忽略, DEEPSEEK团队研究直接用RL 直接跳过最近几年流行的在原始训练+FINE TUNING的方法。成就已经得到业界肯定。

DEEPSEEK的这次飞跃无论从算法,科技还是LICENSE道德层面完全符合现行国际公认的认可的标准。 得到这样的荣誉完全实至名归。
 
是真有水平,还是一个joke, 需要时间的检验和证明。

一个藤校的学霸,花巨资和巨量的时间做出来的世界级最先进的工具,被一个不入流的二流凡人用极其短的时间,花极少的钱超越了。

按正常的思维,和有电脑工程师工作经验的正常人判断,得到的结论就是不可能。

CFC 上有你们这些一点就着,不做自己的分析和判断,就欢呼雀跃的人充斥,真是low 得可以。

Shame on you!
这些新兴科技我不懂,但是如果你随便浏览一下这几天的新闻,尤其是西方媒体,可能很多结论不是你这么简单直接推出来的。

起码应当open mind, 多看看,想想再下结论。
 

为什么老外在deepseek上面慢半拍?​

180k 01-26 00:17
侧面证明我们本土的AI科研,真正走到了技术了前沿。
梳理下时间线,

1月20日 - DeepSeek - R1 正式发布,对标O1;因为业界一些其他人喊“对标”喊到习惯了,当时很多人还没意识到这次 R1 巨大的范式转移。

1月21日 - AI业界已经被 DeepSeek的论文震撼;RL一直都只是一个难以实现的概念(参考Google Alex Pan 2018年的那篇"RL仍未出现"); Jim Fan等有影响力的从业者开始大夸Deepseek

1月22日 - 星际之门发布;500B + 特朗普 + OAI,吸引了几乎所有的媒体资源;关税的反反复复也占据了大部分媒体资源(legacy media / mainstream media,随便你想怎么叫)

1月23日 - 业界的新闻开始蔓延到资本市场;零星有一些AI从业者的帖子出圈,譬如Meta员工的“Panic mode”截图;大家开始找相关的材料来消化这个信息。

1月24日 - 资本市场开始出现反应;JPM交易台在当晚交易的时候,95%的问题都和Deepseek相关;BofA交易台,被问的最多的问题也是有关Deepseek;只不过当时卖方也仍然没有意识到事情的“严重性”;NVDA似乎有些疲软,回吐星际之门后的所有涨幅(本来多出一家大云厂capex应该是能够更加bullish)

1月25日 - X彻底炸裂我还以为我的X算法坏了,10条帖子9条是关于deepseek的;Deepseek被“病毒式”讨论,资本市场,业界,China bull / bear; AI bull/ bear,无一幸免。我甚至在一些擦边博主那里...对的..也看到了deepseek的分析。

Deepseek不是周末才出来,讨论为什么是周末才爆发?

这和OAI当时的发布完全不同,OAI / SORA出现的时候,资本市场/ 业界的反应可是飞快。

这里引用TMTB一个观察;

79cda441-a007-4e83-9dcf-b4f1195d747b.png


ddb85880-a05b-4917-9065-874b24805164.png


JPM交易台 - 很多老外实际上是周末才开始真正的做功课/补习DS-R1的信息;还停留在“介绍Deepseek/ 梁总”这种维基百科类型的信息。​

b5117273-7405-4409-a406-0821f76f0258.png


几个观察,

  1. 信息来自于中文语料;我们追对面的英文,速度很快,基础设施很足够(英语/翻译软件);但是对面对于中文语料的信息,并没有同样对等的热情和重视度。
  2. 我们的大V / 媒体不够mainstream;这没什么好说的,第一也是因为语言,第二也是因为“legacy media”卡位了主流叙事,这不是一天两天能完成的;很多媒体/财经从业者在慢慢努力,譬如BAIGUAN这类的媒体(BAIGUAN老板,如果你看到的话记得给我点个赞)在慢慢为我们带来更多的影响力。
  3. 定价权;就算你在周一的时候慧眼识英雄,意识到了这个deepseek叙事的重要性,ALL IN做了semi capex的短期put,你也会被周二的星际之门教训的体无完肤;我们的资金连港股的定价权都没有拿下,在美股更不要谈地定价权这个说法
  4. 美国例外主义;很多的美国投资者长期熏陶在主流媒体中间,他们根本不在乎我们本土发生了什么,也不需要在乎。花了50%的精力,去研究Portfolio里面不到5%低配的市场?难。当然之后如果deepseek叙事继续,很多老外需要开始慢慢跟进中文信息,来保护他们的AI exposures;
上面提到的那篇关于RL的,很建议大家看看。看完你就知道Deepseek的这次技术突破有多么不容易。​

d8ce4e43-2ed9-4314-80e4-479ea4081cd2.png


今天Sam的帖子有点小丑了;做了一天AI界的汪峰。

0cae8a9d-87c8-4c4b-9cca-6ba4087a43b7.png


be851d4e-6c35-430f-bb00-4b354319880b.png


dd39f7cf-8f93-41e5-b4fd-278146c793f1.png


最后的最后,说一句。很多人还没有意识到的一个巨大范式转移是,这次老外慢半拍的一个现象,侧面证明我们本土的AI科研,真正走到了技术了前沿

引述梁总的访问,佩服佩服。

d122347d-3ee2-47b9-b82a-131b580dce76.png

文章来源:180K 原文标题《为什么老外在deepseek上面慢半拍?》

 
浏览附件1166193

大牛就是牛B,一点都不酸

是真有水平,还是一个joke, 需要时间的检验和证明。

一个藤校的学霸,花巨资和巨量的时间做出来的世界级最先进的工具,被一个不入流的二流凡人用极其短的时间,花极少的钱超越了。

按正常的思维,和有电脑工程师工作经验的正常人判断,得到的结论就是不可能。

CFC 上有你们这些一点就着,不做自己的分析和判断,就欢呼雀跃的人充斥,真是low 得可以。

Shame on you!
你有正常思维吗?是正常人吗?

可以按照正常判断,你对于人工智能就是就是无知小白,别侮辱正常了,心里全是偏见,充满无知。

美国几十个媒体都报道了这个事,没有一个有你这种“正常”的思维。

脸谱首席科学家,副总, 世界人工智能排名前三的Lecun也承认deepseek 领先,都没有你这种“正常”。

deepseek所有的东西,除了数据,算法程序训练方法都是开源,每个人都可以打开检查测试,全世界科学家都没有你“正常”。

按照你“正常”的思维,几乎全美国主流媒体都不“正常”,都low.
精神病看所有的人都是精神病
 
最后编辑:
一个瑞士著名人工智能教授,瑞士一个人工智能CTO, 花了1个多小时解读DEEPSEEK 开源后公布的论文。

满篇的数学,估计没几个人能看懂。:)

DEEKSEEK 这次算核弹级别事件了,还从数学,具体的实施,详细介绍,全世界相关的AI , ML 前沿公司都加班加点研究分析了。:)



View: https://www.youtube.com/watch?v=bAWV_yrqx4w
 
这要把老黄的根给挖了,够狠的

你说得没错,福布斯报道,NVIDIA股票可能因为deepseek 下跌。

deep seek以前的东西都是靠大数据和无限算力来支撑的,所有公司都添加GPU。deepseek 开启了一条新路,证明了不需要那么多参数和那么大的算力就能达到或接近现有最高水平。对于很多企业来说,少一个数量级别的运行花费肯定非常有吸引力,除非chatgpt 能够提供高得多的性能

Microsoft is very impressed with DeepSeek’s accomplishments. “To see the DeepSeek new model, it’s super impressive in terms of both how they have really effectively done an open-source model that does this inference-time compute, and is super-compute efficient,” CEO Satya Nadella said January 22 at the World Economic Forum. “We should take the developments out of China very, very seriously.”
微软CEO也不吝惜表扬。


Chatgpt 运行耗资巨大,电费惊人,连微软都受不了,有报道说,微软都决定不用chatgpt了,因为实际上如果考虑运行成本就是亏本,而且运行起来太慢,微软决定自己开发或者使用其他第三方的AI 模型。
 
后退
顶部