2024 我重度使用 AI 的一年
2024 过去了,这里写一篇一年来 AI 行业观察的总结。
为什么特别关注 AI? #
全世界都知道 AI 是当前人类科技大跃进的推动力,仅仅是观察这一切的发生就极大满足了我的好奇心,并不断提升我对未来的期待。也让我最近一年很多时候都是东八区的凌晨一点后才睡觉,因为这个时间点几乎每次是美国宣发最新 AI 产品的时间,可以看到我的推文蛮多都是这个时间在发出感叹。
从 2023 年初订阅 ChatGPT 开始,到 2024 年已经成为我的生活必需品,以下是我看到和感受到的变化。
最前沿的行业:又是飞速演进的一年 #
- 智能水平的提升:最强的 o3 在编程和数学方面已经达到人类的顶尖水平。
- 第一梯队格局变化:从年初 OpenAI 的 GPT-4 一家独大,演变为 OpenAI、Anthropic Claude 和 Google Gemini 三强并立的状态。
- 第二梯队加速逼近:GPT-4 的智能水平已经被第二梯队超越,包括中国的阿里 Qwen 和幻方 Deepseek。
- 模型推理方式跃迁:模型最高智能切换至基于 CoT 的 reasoning 模型,其中 o1 发布三个月后的 o3 推翻了多个智能评估体系。
- 多模态长上下文成为原生标配:能识图,能语音交互,模型上下文门槛拉到 128k(三百页左右文档体量)
- 文生图的竞争:与 OpenAI 相同 Midjourney 也失去垄断地位,FLUX.1 和 Recraft 模型也足够惊艳。
- 视频生成的崛起:百花齐放,不少尝鲜者已经做出有意思的短片,其中中国的可灵表现尤为突出。
- 智能感知边界的拓宽:不再只是数据,更多厂商开始探索智能对空间的理解,以及机器人如何进化并进入人类现实生活。
编程领域的 AI 渗透 #
最显著的突破来自 Claude 3.5 Sonnet,它让辅助编程从 GitHub Copilot 的智能补齐,一跃跨越到能承担初级编程任务。v0 bolt.new 工具甚至可以一句话生成完整的工程代码,而 o1 系列更能胜任一定复杂性的编程任务。
年中,我在公司分享并演示了使用 Cursor 进行功能开发。到了年底,许多营销标题如“不懂代码,用 Cursor 几小时开发产品卖出百万”频现,反映出代码开发的趋势已从人工编写转向人机协作的试错优化模式。
我感受是,采用AI辅助的开发人员在2024年底能比纯手写效率高一两个数量级。开发者们需要从“会写代码的人”转向“懂得如何让 AI 写更好代码的人”。
今年底还在706 创造者社区的 Cursor 编程共学课程上,作为讲师给人分享如何使用 Cursor 来辅助编程,最终不少原本不熟悉编程的小伙伴也做出了一些作品。
信息获取场景变革 #
今年,我退订了 AI 通用搜索 Perplexity 和面向编程搜索的 Devv。前者被 ChatGPT 和 Gemini 的内置搜索功能取代;后者则显得像一个过渡产品,因为编程辅助已从传统的“搜索+编写”进化为直接让模型完成代码生成。
如今,常识性内容通过 ChatGPT 即可获得。最近我读到古希腊的内容时,忽然想了解“与希腊城邦时代同期的中国正处于什么朝代”,过去需要多次 google 搜索查找对照相关信息对照,而现在只需一句话,几秒钟内即可得到答案。
最近刷到回顾 2000 年香港《百万富翁》节目的影片,最早人们获取知识只能去看书,而互联网到来后可以通过全网信息检索获得,而现在只需要随口一问,不到三十年年间已经是指数级的效率提升。
我订阅的 AI 产品 #
我订阅了第一梯队御三家 OpenAI ChatGPT,Anthropic Claude,Google Gemini,它们具备以下能力:
- 联网搜索(Claude 可通过 MCP 实现)
- 项目管理功能,支持共享指令和文件
- Canvas 或 Artifacts 内容预览编辑能力
- 代码编写与执行(Gemini API 可生成代码并基于执行结果作出调整)
虽然订阅三家主流产品看似重复,但它让我第一时间体验到最先进模型。我相信这些模型厂商是最了解模型最佳用途和其能力边界的群体。
2024 年热门的编程 Agent 产品 Cursor Windsurf Bolt.new 都悉数订阅,并且保留 Cursor 作为我日常编程伙伴。
此外,我还乐此不疲地花钱体验各种工具,如音乐生成的 Suno 和 Udio,图片生成的 Midjourney。这个时代每月掏出 $20 美金,能体验上最前沿人类科技,你敢想么?
对于价格这个事情,我还发文调侃过,20 美金可以买多少杯饮料😄。
最后 #
最早在科技行业中提到效率这个词,可能提到的是某一款自动化的软件,一组快捷键,某种硬件设备,而现在效率基本被 AI 能完成多少所替代。
假如效率已经完全被辅助人类的 AI 达成,那么更进一步的创造被 AI 实现可能也不远了。
我开始感觉到,小时候看的科幻与当前现实的边界已经开始模糊。。。
备注 #
- 我从 Claude 3.5 发布后开始订阅。
- 我从 Google Gemini 2.0 发布后开始订阅 Google One。
- 我在2025年一月已经切换到 $200 每月 ChatGPT Pro 套餐,体验随时能与最强大的 o1 Pro 对话的能力。
- 706 社区的 Cursor 共学活动以及成果展示,在 Youtube 上也有完整课程回放。
- Previous: AGI 曙光 ChatGPT