Retool 发布了《2023 AI应用现状报告》,基于上千名不同岗位的科技行业从业者调研总结而成。
简介
开篇提及以 ChatGPT 为代表的生成式 AI 在 2023 年似乎无处不在。
教师、政治家、脱口秀主持人、公共汽车司机和你的祖父母可能会使用法学硕士来超越谷歌和古怪的喜剧片段——但这些日常用例只是触及可能的表面。深入挖掘,与技术密切合作的人们正在使用广泛的人工智能工具来改造产品,重新想象业务,并以以前无法想象的方式提供客户体验......或者,至少,这就是承诺。
「美帝天天过年」实不我欺。
该报告以访谈调研为主,有超过 1500 名科技类从业者受访参与,包含软件工程师、工程/业务团队主管、CEO、产品、设计师等等。
对于 AI 的真实感受
主要调研大家对 AI 的感受、AI 投入的评估、流量、招聘等:
- 超过一半(51.6%)的受访者认为当前 AI 处于过誉状态
- 但有近一半(44.9%)的受访者认为其所在公司在 AI 方面的投入不足,与之相对认为投入过多的仅有 4.4%
- 上面两点看似相悖?Retool 认为这可能反映了「尽管 AI 现在还不成熟但大家都认同其有价值」
- 开发者逐渐抛弃 StackOverflow,GitHub Copilot 和 ChatGPT 是主要原因
- 招聘主管更青睐熟练使用 ChatGPT/Copilot 的候选人,且相比大公司(6.1/10),初创企业(7.1/10)的这种偏好更显著
感想:
- 超过一半人认为过誉稍有些意外,或许应理解为科技从业者对于 AI 的真实应用发展存在不满,毕竟每天睁开眼就是 AI 的消息,结果能真的用起来的产品寥寥无几,会有落差。
企业对 AI 的应用情况
调研不同规模、不同层次公司对 AI 的应用情况、使用场景、反馈、痛点等:
- 绝大部分公司还处于应用 AI 的早期阶段
- 内部使用为主、外部应用谨慎,2/3 的受访者所在公司已上线了至少一个内部用例
- 常见的使用场景:
- 代码、查询(比如 SQL)及其测试
- 知识库 Q&A
- 文案创作
- 数据分析
- 客服聊天机器人
- 认为上述应用某种程度上有用的比例高达 96.5%
- 有趣的是,来自 AI 应用领先公司的受访者认为现有用例非常有用的比例更高,但也更容易视某项用例无用、甚至是浪费时间,分析者认为这帮人对 AI 最为熟悉,所以他们的意见极化更显著
- 面向客户的(即外部)用例:
- 现有产品内功能,如自动化、搜索、可视化、内容审核等
- 客服聊天机器人
- 知识库 Q&A
- 开发 AI 应用的最大痛点是模型输出的准确性(39.4%)和数据安全(33.4%),幻觉(28.1%)和成本(27.9%)紧随其后
- 数据安全的重要程度与公司规模基本成正比
- 几乎所有人都在用 AI 辅助工作,无论公司是否允许(超过三成偷偷用)
感想:
- 内部和外部应用确实有不同的门槛,不过想必那些早早在内部用例上培养 AI 能力的团队会有先发优势(又或者做了会被 OpenAI 替代的无用功?)
AI 配套工具
讨论模型、自部署、开发工具等:
- OpenAI 一骑绝尘,已成 AI 应用开发的默认选项
- 随着企业规模增长,选择自部署模型的比例越来越高(5000+ 人的大公司有 1/4 会自部署)
- 与之相对,约一半的受访者称其所在公司未做任何自定义(包括 fine-tune、向量数据库、自训练等)
- 开发工具方面,Hugging Face 和 LangChain 受欢迎
- 但大部分开发者还没有形成 prompt engineering 的最佳实践,不追踪提示词表现(25%)、人工测试(35%)普遍存在
- 被问及的 AI 应用和功能中,只有 GitHub Copilot 和 Grammarly 的使用者超过 10%
- 初创(1-99)、中等(100-999)、大厂(1000+)公司各自最喜爱的向量数据库分别是 Pinecone、Postgres[pg_verctor]、Chroma
感想:
- 可视出来更能感受到 OpenAI 的统治力
- 提示器优化及其与 AI 应用开发的统一实践还有空间,短期看来通用模型的 prompt engineering 还是必修课
结论
总体而言,尽管多数 AI 相关内容还没达到用户日用的程度,但 2023 这一年我们的确见证了大语言模型(LLM)的爆发。绝大多数的科技公司已经在使用类似 GitHub Copilot 的 AI 产品,或者是在用 OpenAI 的模型开发一些内部工具。报告收集了受访者的想法制成了词云:
有很多值得探讨、思考和尝试的,但想必这只是开始。
调研方法
读到最后才发现 Retool 这份调研是 8月做的…
本报告中的见解来自2023年8月对1578人的公开调查。
- Top5 行业
- 技术,39%的受访者
- 咨询/专业服务,12%的受访者
- 金融服务,10%的受访者
- 消费品,5%的受访者
- 媒体和通信,5%的受访者
- Top5 团队
- 工程,38%的受访者
- 运营,22%的受访者
- 产品,12%的受访者
- IT,9%的受访者
- 数据,7%的受访者
- Top5 岗位
- 中高级水平,28%的受访者
- 董事/经理,23%的受访者
- 入门级,20%的受访者
- C-suite,17%的受访者
- 副总裁,3%的受访者
- 公司规模
- 1-99名员工,60%的受访者
- 100-999名员工,26%的受访者
- 1000多名员工,14%的受访者