News

最近一个争议比较大的新闻,要属“OpenAI收购Cursor不成,反过来要收购AI编程初创里的老二Windsurf”。30亿美元,特别是对于一家仅仅成立2年,且目前品牌运营时间仅约5个月的创业公司来说,可以说是非常体面和梦寐以求的退出额度。
2025 年 4 月 19 日,全球首场人形机器人半程马拉松在北京亦庄落下帷幕。尽管赛事暴露出运动控制、续航散热、环境适应性等核心技术短板,却也成为产业发展的 “试金石”。对于中小企业而言,这些痛点恰恰是切入人形机器人生态的突破口。
当大家带着疑问仔细阅读System Card,发现OpenAI官方也承认了这个问题,与o1相比o3幻觉率是两倍,o4-mini更是达到3倍。 而且不只OpenAI一家出现这个问题,谷歌、xAI也同样,Grok-3的幻觉比Grok-2严重,Gemini ...
此外,OpenAI技术团队成员Wenda Zhou在上周一次直播中坦言,相较于去年12月,经过优化后的o3更适合现实世界的用例,更侧重于真实使用场景与推理速度。因此,它在基准测试上可能会出现一些「偏差」。
4 月 21 日消息,据外媒“Voice of San Diego”4 月 14 日报道,现如今线上教学已经蔚然成风,但一种被称为“机器人学生”的现象在美国社区大学日益普遍。这些“学生”并非真正为学习而来,而是为 在领取助学金之前维持在籍身份 而注册 ...
要知道,o3和o4-mini在Codeforces中成绩均超2700分,在全球人类选手中位列TOP 200,被称为OpenAI有史以来最好的编码模型。
互联网泡沫,也称dot-com泡沫或dot-com热潮在上世纪90年代末期并最终于2000年3月10日达到顶峰的一次股市泡沫。从1995年至2000年3月的高峰期,投资于NASDAQ综合指数的资金增长了800%,而在2002年10月之前,该指数又从其 ...
研究人员最后囤点,像上面这样的短语在R1训练时的推理轨迹中非常常见,因此模型实际上将其视为提示的一部分。(类似的前缀在R1的推理轨迹中极为常见:超过95%的英语推理轨迹都以「好吧」开头)。
谷歌的AI编码能力正在掀起一场风暴!在高尔顿板 测试中,Gemini 2.5 Flash以惊艳表现击败OpenAI多款模型,连谷歌首席科学家Jeff Dean 都为其点赞。谷歌新模型「dayhush」已在网页开发领域崭露头角,性能超越Gemini 2 ...
当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时,加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹:别再卷 token 了,无需显式思维链,推理模型也能实现高效且准确的推理。
多家机构的Windows管理员报告称,微软Entra ...
但最近,美国的国际计算机协会(Association for Computing Machinery,ACM),发布了一篇博客文章,表示:文科和计算机科学,这两个专业最后可能合流,融合在一起才能存活。 报告链接:https://www.amacad.org/humanities-indicators/higher-education/bachelors-degrees-humanities ...