开源日报 | ECMAScript 2024;首个全尺寸开源通用人形机器人;Linux紫屏;新的计算范式;“开源GPT-4o”
创始人
2024-07-05 00:02:35
0

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.7.4省流概览

-ECMA 2024 正式发布

-Visual Studio Code 1.91

-“开源 GPT-4o” 来了

-Andrej Karpathy 解释了新的计算范式

-本地运行的开源模型桌面程序

-中国首个全尺寸开源通用人形机器人公版机“青龙”

-李彦宏:激烈的竞争环境中,商业化的闭源模型是最能打的

-LLM 指令微调教程代码开源

今日要闻

ECMA 2024 正式发布

详情

https://262.ecma-international.org/15.0/

Visual Studio Code 1.91

Linux 内核的 Panic 界面有了二维码

Linux 6.10 引入了一个新的 DRM Panic 处理程序基础设施,以便于在出现内核致命错误 (Panic),或者 VT 支持可能被禁用的情况下显示相关信息。近日,Red Hat 的另一位内核工程师,同时也是 DRM Panic 贡献者 ——Jocelyn Falempe 提交了新补丁,用于在 DRM Panic 界面中显示错误消息二维码。

今日观察社交观察

OpenAI 联合创始人 Andrej Karpathy 解释了新的计算范式

“我们正在进入一个新的计算范式,大语言模型就像 CPU 一样,使用 Token 而不是字节,并且有一个上下文窗口而不是 RAM。这就是大语言模型操作系统(Large Language Model OS, LMOS)。”

- 微博宝玉xp

玛丽大姐又写了新的报告:Al & Universities

- 微博明浩-rosicky311

LLM 指令微调教程代码开源

如果你正在寻找资源来学习 LLMs 指令微调过程,这里有一个开源笔记本教程可以从头开始指导你实现微调过程。

它解释了

- 如何将数据格式化为 1100 指令 - 响应对;

- 如何应用 prompt-style 模板;

- 如何使用掩码。

也包括关于实现基于 LLM 的自动化评估过程的部分。

- 微博量子位

“开源 GPT-4o” 来了,法国 AI 实验室发布原生多模态 Mosh

只需 8 人团队 4 个月打造,现场惊艳演示引 LeCun、Karpathy 大佬转发。

- 模型训练流程和模型架构简单且可扩展性极强,Kyutai 这样的 8 人以上小团队在 4 个月内就构建了它。合成数据在这里发挥了巨大作用

- 专注于本地设备:Moshi 很快就会无处不在。Kyutai 还开发了一个较小的 Moshi 版本,可以在 MacBook 或消费级 GPU 上运行。

- 低延迟:延迟在 300 毫秒以下

官网地址:

https://kyutai.org/

试用地址:

https://moshi.chat/?queue_id=talktomoshi

- 微博新智元

HR 部门和人员在中美科技公司的存在感差别太大了

在美国科技公司,HR 算是幕后工作人员。一般普通工程师,没事和平时一般根本感觉不到他们的存在,更别说打交道。

我在惠普、苹果和英伟达工作的 17 年里,从来没有和任何 HR 部门的人直接打过交道。离职交接也就是在网上填表,最后把设备和工牌交给部门的行政秘书就完事。我所在的部门对接的 HR 或 HRBP,我从来不知道是谁。

- 微博硅谷陈源博士

本地运行的开源模型桌面程序

GPT4All 是一个能在消费者硬件上,在本地计算机跑语言模型的开源项目,完全支持 Mac M 系列芯片,AMD 和 NVIDIA GPU。项目组刚发布了 GPT4All 项目的 1 周年纪念版(GPT4ALL 3.0,地址:blog.nomic.ai/posts/one-year-of-gpt4all),主要是对界面和 LocalDocs 体验进行了重新设计。

着重说一下 LocalDocs,这个功能允许用户使用自己的本地文件中的知识,确保数据仍然存储在本地设备,而 “不会被发送给试图控制用户数据访问以改进自身 AI 技术的公司”。

- 微博高飞

媒体观察

中国首个全尺寸开源通用人形机器人公版机 “青龙” 发布

在 7 月 4 日下午举行的 2024 世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,中国首个全尺寸开源通用人形机器人公版机 “青龙” 发布

-第一财经

蚂蚁井贤栋:通过专业智能体的深度连接,AI 会像互联网一样带来服务的代际升级

井贤栋说,在移动互联网时代,二维码让移动支付成为每个人的生活日常,“扫一扫” 让小商家用最低的成本享受支付的便利。“在人工智能时代,我们也在探索,让 AI 像扫码支付一样便利每个人的生活,让 AI 技术发展的红利惠及更多人。”

-中国经济网

AI 时代,中国占到了意想不到的先手

在 AI 时代,中美科技竞争中,这样对中国有利的因素还会有很多。比如,依靠强大的基础设施与网络建设,从智能家居、智慧城市到工业物联网,中国能为 AI 技术找到广泛的应用场景,这也是其他国家很难效仿的。在农村,大量摄像头和传感器的部署,使得农业生产,如灌溉、养殖的监控,都找到了智能解决方案。能有这样一个大规模智能物联网市场的前提,依然是当初不计回报的通水、通电、通路、通网。

-心智观察所

李彦宏:激烈的竞争环境中,商业化的闭源模型是最能打的

百度创始人、董事长兼首席执行官李彦宏在 2024 世界人工智能大会上,谈及开源闭源之争时表示,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低时,商业化的闭源模型是最能打的。

-一财网

独家对话腾讯混元刘煜宏:做大模型可以有「深圳速度」,但不能跳步

大模型注定是一场长跑,「AGI 目前更像信仰」,但将腾讯混元大模型能力在内部 700 个业务上用得好,是刘煜宏认为对于 AGI 的务实追求。有远见但务实,也是混元团队在大模型上的世界观对齐。

-今夜科技谈

新京报发布中国 AI 大模型测评报告,9 款大模型长文本能力待提升

报告包含针对公众及传媒行业的调查问卷,新京报人工智能研究院还研发了针对大模型助手传媒能力的测评体系,本次测评共综合考察了 9 款大模型助手的文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力。总体得分上,通义千问、腾讯元宝、讯飞星火夺得前三名;横向对比来看,翻译能力、事实核查与价值观判断能力两项能力最令测试员满意,而长文本能力则得分最低。

-新京报

全球 AI 大模型竞赛,美、中之外还有谁?

当视线扩展到中美之外,尽管 AI 独角兽企业的涌现没有中美那样频繁,但它们依然像世界各地散落的珍珠,每一颗都以其独特的光芒闪耀着。从欧洲的心脏地带到亚洲的新兴市场,再到北美的科技巨头,这些大模型独角兽的发展轨迹,推动了各自国家和地区的科技创新,而且为全球人工智能技术的发展注入了多元化的视角和创新动力。

-元素elements

今日推荐

开源项目

conan-io/conan

https://github.com/conan-io/conan

Conan 是一个去中心化、开源 (MIT)、C/C++ 包管理器。

  • 它是完全去中心化的,用户可以私下将他们的包托管在他们的服务器上
  • 适用于所有平台,包括 Linux、OSX、Windows、Solaris、FreeBSD、Docker、WSL
  • 管理二进制文件。它可以为任何配置和平台创建、上传和下载二进制文件, 甚至交叉编译,节省大量的开发和持续集成时间。
  • 与任何构建系统集成,包括任何专有和自定义系统。
  • 可扩展:具有强大的功能和灵活性

每日一博

大模型产品化第一年:战术、运营与战略

过去一年里,我们一直在进行构建,并在过程中发现了许多棘手的问题。虽然我们的经验并不代表整个行业,但我们希望分享自己的经验来避免同样的错误并加速迭代。我们将经验总结为以下三个部分:

战术层面:一些关于提示、RAG、流程工程、评估和监控的实践建议。无论你是通过 LLM 进行构建的从业者,还是出于兴趣在周末进行项目开发,这部分内容都具有参考价值。

运营层面:发布产品的日常组织和管理问题,以及组建高效团队的方法。这部分适合想要可持续且可靠地部署产品的产品 / 技术领导者。

战略层面:长期、宏观的视角,包括诸如 “在产品市场契合(PMF)之前不要使用 GPU” 和 “专注于系统而非模型” 等有见解的观点,以及如何进行迭代。这部分为创始人和高管量身定制。

https://my.oschina.net/oneflow/blog/11213900

开源之声

用户观点

Linux 不仅可以 “蓝屏”,还可以 “紫屏”、“黑屏”……

  • 观点 1:额……Windows 现在的蓝屏可读性比较强,但是看目前 Linux 的那个蓝屏,似乎没有提升可读性,也没有提供排错指南,只是简单的把 kdump 由屏幕上放到了二维码上……。还不如默认把崩溃文件存储直接打开,放硬盘上好了。这样我重启下电脑还可以去读文件,然后再去查崩溃原因。说电脑屏幕有时显示不下,所以把 “彩色的” 蓝屏放到手机上,难道手机屏幕还大得过电脑屏幕?
  • 观点 2:这算 “屎上雕花” 吗?
  • 观点 3:花式嘲讽了属于是
  • 观点 4:我记得零几年的时候,我就会把一堆淘汰的硬件去攒机,目的就是挑战它能不能正常工作,并且不蓝屏~
  • 观点 5:Kernel Panic,怎么个 Panic 法,人家 Windows 报错至少代码和原因会给你写的一清二楚
  • 观点 6:啊?这是简化?
  • 观点 7:看了下解码后的数据,是个网址,报错信息被编码在 URL 参数中,感觉表示报错信息的数据还可以压缩一下信息密度,比如 gzip 压缩后编码为 base64,长度会小很多
  • 观点 8:自从用了 ecc 内存,好像很久没蓝屏过了
  • 观点 9:windows 领先十几年
  • 观点 10:有点像 Linux 版 “黑伦”
微软 WSL2 过渡至 Linux 6.6 LTS 内核
  • 观点 1:5. 几就老化了?我用的还是 3.10 内核
    • 观点 2:那你说 jdk1.8 老不老
    • 观点 3:4.x 之下,docker 有一个隐藏 bug,因为内核的原因。大部分情况不会出问题,个别情况可能会导致 docker 无法创建容器。当然一般情况问题不大
  • 观点 4:终于更新了,还以为 wls2 不维护了
  • 观点 5:wsl 用的是 ubuntu,追的是最新内核。

程序员梗图

END

References

https://www.oschina.net/news/300379/ecma-2024

https://www.oschina.net/news/300318/vs-code-1-91-released

https://www.oschina.net/news/300327/linux-drm-panic-qr-codes

https://weibo.com/1727858283/OlZeUxIDQ

https://weibo.com/5703921756/OlY6fyHYQ

https://weibo.com/6105753431/OkujIqR2O

https://weibo.com/1233486457/OlNSjetkJ

https://weibo.com/1697716777/OlOw2BzO3

https://weibo.com/6974787068/OlJHxciCB

https://mp.weixin.qq.com/s?__biz=MzkxODcwMzI2MA==&mid=2247483861&idx=1&sn=7f7115b6c9bf13f83ca13cc08beb04e8&chksm=c1ac1c26f6db95306a48d269319e62ec0b87595c726de0e174c926798f945ac24e14f626b712#rd

https://k.sina.cn/article_1644114654_61ff32de02001tgdu.html

https://finance.sina.cn/tech/2024-07-03/detail-incawewk8260312.d.html?fromtech=1

https://cj.sina.com.cn/articles/view/1733360754/6750fc72020019o9e

https://mp.weixin.qq.com/s?__biz=MzA3MTI1MjU1Mw==&mid=2651141732&idx=1&sn=485f0227cd2e66bd16123c0027297f1d&scene=0

https://finance.sina.cn/2024-07-04/detail-incayivc5754683.d.html

https://a.mp.uc.cn/article.html?uc_param_str=frdnsnpfvecpntnwprdssskt&&from=media#!wm_cid=629211487111485440!!wm_aid=9685862746178990409!!wm_id=1709157a815b423aab98ca7338f2971a

https://my.oschina.net/oneflow/blog/11213900

https://github.com/conan-io/conan

https://mp.weixin.qq.com/s/UWDWEGCNQtIIrQpoxZs-_g

https://www.oschina.net/news/300177/microsoft-wsl2-linux-6-6-kernel

最后,欢迎扫码下载「开源中国 APP」

阅读海量技术报告、程序员极客分享

相关内容

热门资讯

玩家必看秘籍!微扑克专用辅助程... 玩家必看秘籍!微扑克专用辅助程序用的啊,掌酷13张外挂,揭秘攻略(有挂细节)-哔哩哔哩;掌酷13张外...
分享给玩家!wepoke软件透... 分享给玩家!wepoke软件透明挂,约局吧是正规的,wepoker确实有挂辅助挂,爆料教程(证实有挂...
8分钟了解!wpk微扑克真的有... 8分钟了解!wpk微扑克真的有挂(透视)外挂透明挂辅助器(2023已更新)(哔哩哔哩)是一款可以让一...
总算了解!wepoke软件透明... 总算了解!wepoke软件透明挂,aa扑克,智星德州菠萝确实是真的有挂,必赢教程(有挂头条);1、点...
我来向大家传授!WePoKe软... 我来向大家传授!WePoKe软件透明挂,wepoke系统是免费的,聚星扑克原来是有挂辅助挂,我来教教...
终于知道!方片十三张辅助器可测... 终于知道!方片十三张辅助器可测试辅助软件!透明挂智能(2021已更新)(哔哩哔哩);一、方片十三张辅...
透视计算!德州游戏辅助器大全,... 透视计算!德州游戏辅助器大全,中至两人跑的快有假的,解密教程(有挂神器)-哔哩哔哩;中至两人跑的快有...
七分钟了解!poker wor... 《七分钟了解!poker world外挂(辅助挂)外挂透明挂辅助器(2021已更新)(哔哩哔哩)》 ...
每日必备!WePoKe软件透明... 《每日必备!WePoKe软件透明挂,aapoker 辅助工具,fishpoker原来一直都是有挂,透...
推荐十款!对战互娱有挂的辅助助... 推荐十款!对战互娱有挂的辅助助手!透明挂线上(2022已更新)(哔哩哔哩);致您一封信;亲爱对战互娱...