
👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦!

The Rise of the AI Engineer → https://www.latent.space/p/ai-engineer
Latent Space 是AI领域最有影响力的播客频道之一,主持人是 Shawn Wang,也就是大家熟知的 Swyx。
一年前,也就是2023年6月30日,Swyx 撰文「The Rise of the AI Engineer (人工智能工程师的崛起)」 分享了他的观察和思考,引起了科技领域的极大关注。

Swyx 绘制了一张岗位光谱图,👈 左侧受到数据/研究约束 (Data/Research constrainted),👉 右侧受到产品/用户约束 (Product/User constrainted);最左侧岗位与机器学习 (ML) 密切相关,最右侧岗位已经不涉及 ML 技能。划分边界就是 API (大模型调用接口)。
目前,底层大模型已经爆发,生成式AI应用也有爆发趋势。两端同时爆发,必将催生大量的人才需求。普通公司受限于人才和算力无法参与大模型训练,因此机会主要在右侧。
因此,大多数公司生存逻辑转变为使用AI能力做出产品。这意味着公司不需要再配备庞大的 ML 算法团队,而是专注于调用大模型 API 并进行产品化。这就是 AI Engineer (人工智能工程师)。
不同于 Prompt Engineer 成为各岗位兼具的基础技能,AI Engineer 必须是全职岗位,因为要处理的挑战又多又关键:① 测评源源不断的开/闭源大模型,② 尝试最新的技术框架和技术产品,③ 紧跟论文/融资/产品/活动等行业动态……
AI Engineer 正在将AI的进步,转化为数百人可以使用的产品。他们可能是独立开发者,可能是一个小型创业团队,可能在知名创业公司 (比如 HeyGen、Figma、Notion),也可能身在微软、谷歌等科技巨头。
AI Engineer 是软件工程衍生出的新分支,专门研究AI的应用并有效运用新兴的技术栈。新岗位的出现,源自平台转换带来的代际变革,曾经的 DevOps工程师、数据工程师等也是这样。
2013年,完成一个AI任务需要耗费整个研究团队5年的时间。而时间来到2023年,你只需要一份 API 文档和一个空闲的下午。

[Latent Space] 播客共50分钟 → https://www.latent.space/p/high-agency
前段时间,「The Rise of the AI Engineer」这篇文章的作者 Swyx,串台播客频道 High Agency,与 Reza Habib 聊了聊文章出圈一年后,他最新的观察与思考。
Swyx 试图从多个角度更精准地描述 AI Engineer (人工智能工程师) 这个新兴岗位,比如与 ML Engineer (机器学习工程师) 的边界,与AI产品经理的协作新方式等等。
AI Engineer 更多处于0到1的阶段,而 ML Engineer 更多处于1到N的阶段。
AI Engineer 更多地思考产品,ML Engineer 要处理具体的端到端问题 (基于 baseline 为某个特性问题构建或优化模型,实现具体的数据目标)。
AI Engineer 的世界由模型开始,到产品结束,更接近全栈开发;ML Engineer 世界从模型开始,到模型结束,数学要非常好。
在一个成熟团队里,AI Engineer 和 ML Engineer 的比例大约是四比一。
换个角度理解,AI Engineer 承包了 ML Engineer 工作中与模型无关的部分,使得 ML Engineer 有余力和能力去研究模型。或者说,市场并没有足够多的 ML Engineer 储备,因此需要一个新的角色来填平各方的需求。

传统机器学习工作流是 aim - ready - fire,要求 Data / ML Engineer 先收集数据、再训练模型、最后投入生产。
基于AI的 LLM 工作流是 fire - ready - aim, AI Engineer 先使用提示词快速构建和验证产品创意,再获取特定数据进行微调。不仅速度快,而且成本低 (只有传统工作流的千分之一到万分之一)。
在小团队里,AI Engineer 可以胜任产品经理的职能,洞察客户需求,并为产品选择正确的方向。
在大团队里,产品经理依然无可替代,这时 AI Engineer 负责提供基础模型的最新动态,并与产品经理一起,通过提示词来快速验证产品创意是否可行。

原文详细介绍了作者做的每一件事情 → https://adamfallon.com/2024/07/10/so-you-want-to-become-an-ai-engineer
作者是一名高级iOS开发工程师。他用一年时间顺利转型升职,并开始担任公司的 AI Engineer 主管。并在文章中详细记录了自己的成长过程。
路径不是唯一的,但这个过程中的思考和经验,还是很有借鉴意义的!!作者还分享了一份优质学习资料清单!!
生成式AI正在迫使软件工程师去贴近产品开发。
未来,大模型能力一旦突破某个临界点,软件工程师的编程能力将基本被AI取代。届时,软件工程师的竞争优势就变成了:对AI模型的功能进行巧妙的组合,打造有趣的产品,推进公司的发展目标。
如果这个预测成真,那么技能栈越广泛的工程师,将越受欢迎。

- 作者给出了一份必须清单
坚定职业选择的信心
- 我如何成为一名机器学习从业者 → https://blog.gregbrockman.com/how-i-became-a-machine-learning-practitioner
- 是时候成为一名机器学习工程师了 → https://blog.gregbrockman.com/its-time-to-become-an-ml-engineer
理解机器学习基本概念
- [Book] 百页机器学习 → https://www.amazon.co.uk/Hundred-Page-Machine-Learning-Book/dp/199957950X
- [Video] 线性代数的本质 → https://www.youtube.com/watch?v=kjBOesZCoqc&list=PL0-GT3co4r2y2YErbmuJw2L5tW4Ew2O5B
LLM爆发带来的机会
- 文本是通用接口 → https://scale.com/blog/text-universal-interface
- LLM应用的新兴架构 | Andreessen Horowitz → https://a16z.com/emerging-architectures-for-llm-applications
LLMs及其工作原理介绍
- 图解 Transformer | Jay Alammar → https://jalammar.github.io/illustrated-transformer
- [Paper] Attention Is All You Need → https://arxiv.org/pdf/1706.03762
- [YouTube] Andrej Karpathy → https://www.youtube.com/@AndrejKarpathy/videos
- What Is ChatGPT Doing … and Why Does It Work? | Stephen Wolfram → https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work
微调
- [Episode 1] LLM 实验 (Fine Tuning) → https://adamfallon.com/2024/01/30/experiments-in-llms-episode-1-fine-tuning
向量数据库 + 嵌入
- [Episode 2] LLM 实验 (Memory - Vector DBs and Embeddings) → https://adamfallon.com/2024/01/30/experiments-in-llms-episode-2-memory-vector-dbs-and-embeddings

Elicit 是一家生成式人工智能初创公司。
工程主管 James Brady 写了一篇博文「How To Hire AI Engineers」,分享自己2020年转型AI后的发展历程,以及目前对公司 AI Engineer 这一岗位的人员招聘和培养心得。
一片混沌的当下,有工程团队愿意结合实际经验分享内部信息,并且尝试给出岗位明确的界定,是一件非常难得的事情 🥳

How To Hire AI Engineers →https://blog.elicit.com/how-to-hire-ai-engineers/

一份值得所有AI企业学习的 JD | AI Engineer →https://elicit.com/careers?ashby_jid=d27d51d7-b318-4cb0-9b88-c37de18905f3
Elicit 公司官网的 AI Engineer 岗位招聘说明也非常棒!
不仅详细说明了公司对这个岗位的定位,还给出了目前全部的技术栈、几道自测题,帮助候选人判断是否合适。
而且!还给出了入职后的工作安排,详细到第一周、第一个月、第一个季度的关键进展,都有详细的说明,真的非常清晰且负责 👍

[Latent Space] How To Hire AI Engineers → https://www.latent.space/p/hiring
文章作者 James Brady 也在上个月做客 Latent Space 播客频道,接受主持人 Swyx 的采访,围绕文章和 How To Hire AI Engineers 这个主题,分享了更多多多实际工程经验 (非常多的细节和技巧)~
如果你想成为 AI Engineer,或者想判断下自己的水平,建议收听完整播客节目,或者查看页面转录的文字版本。

Elicit Machine Learning Reading List → https://github.com/elicit/machine-learning-list
James Brady 在 👆 上面文章和播客里反复提到「Elicit Machine Learning Reading List」,也就是 Elicit 公司内部整理的一份 机器学习阅读清单,可以帮助 AI Engineer 快速了解 ML 相关背景知识,以及语言模型的重点内容。
掌握最核心的 ML 相关技能,对 AI Engineer 来说是大大的加分项 🥳 也是真正「入行」必须迈过的门槛~
以下是内容目录。不过,需要说明的是,对于 AI Engineer 的技能边界,业内还没有完全形成共识,所以这个清单也仅供参考~
基础知识
- 机器学习入门
- Transformers
- 基础模型结构
- 训练与微调
推理与执行策略
- 情境推理 In-context reasoning
- 任务分解 Task decomposition
- 辩论策略 Debate
- 工具应用与辅助
- Honesty, factuality, and epistemics
应用领域
- 科学研究
- 预测分析
- 搜索与排序
机器学习实践
- 实际部署
- 性能评估
- 数据集管理
高级议题
- 世界观模型与因果关系
- 决策规划
- 不确定性处理、模型校准与主动学习
- 模型可解释性与调整
- 强化学习技术
宏观视角
- AI的扩展与应用
- AI的安全性问题
- AI对经济和社会的影响
- AI哲学思考
维护者

以 Transformers 板块为例。可以看到,清单中每部分内容都包含4个 tier。按照从1到4的顺序阅读,即可基本覆盖这部分的内容要点~
而且!清单还在持续更新中!✨ 表示在今年4月进行了补充

原文 → https://eugeneyan.com/writing/how-to-interview
Eugene Yan 的上一篇文章你一定读过 | What We’ve Learned From A Year of Building with LLMs →https://applied-llms.org/
Eugene Yan 最最最新长文!
大佬分享了团队在 AI Engineer 招聘时的技能要求,并且给出了非常具体的判断标准。而且!每项技能还给出了几道面试题!!
敢于在行业混沌初期立标准,大佬的魄力不服不行~
- 检查 2D/3D 数组是否满足预定义条件,处理边界情况,并编写单元测试
- 实现并启动一个推理端点,包括输入/输出验证、日志记录、监控和更新端点状态的命令
- 构建一个数据处理管道,先实现批处理,然后改造为流处理
- 你是如何处理数据的?遇到了哪些问题,又是如何解决的?
- 你遇到过哪些具有误导性的汇总统计?哪些统计更有用?
- 你创建过哪些有见地的数据可视化,为什么?哪些可视化效果不佳?
- 你遇到过哪些意外或有偏见的输出?如果需要,你是如何处理的?
- 你在模型周围设置了哪些防护措施或策略,以确保其与用户需求一致?
- 如果你发现模型中出现了偏见,你会如何缓解?
- 你如何随着模型的重新训练或更新来衡量其性能?
- 当模型性能突破预定阈值时,你会如何应对?
- 你是如何收集初始评估数据并构建评估框架的?
大多数技术技能是可以培养的,而主人翁意识、资源调配能力和坚韧不拔的毅力这类特质可能只能靠招聘。
一个主观观点:强有力的人才应具备的核心特质包括渴望、判断力、同理心。

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!