"AI won't exist as an app. Or a button. It'll be an entirely new environment — built on top of a web browser."—— Dia Browser
你们发现没有,最近几乎所有的 AI 大厂都在做浏览器:
连 Claude 的桌面端都是基于 Chromium 的!
这背后到底发生了什么?为什么大家都盯上了浏览器?
你想想,你每天上网干啥?
所有这些,都在浏览器里完成。
这就是为什么 Chrome 能统治互联网这么多年——它掌握了流量入口。而在 AI 时代,谁掌握了浏览器,谁就掌握了 AI 应用的最佳场景。
1. 上下文就是金矿
在 AI 时代,上下文就是一切。浏览器天然拥有:
这些信息对 AI 来说,就是理解用户意图的"宝藏"。
2. 浏览器是 AI Agent 的最佳载体
想象一下 AI Agent 能做什么:
这些任务,80%都要在浏览器里完成。
3. 绕开应用商店这道坎
做手机 App 要受苹果、谷歌的限制,但浏览器不用。你可以:
先说说背景:The Browser Company 成立于 2019 年,累计融资 1.28 亿美元,估值超过 5.5 亿美元。他们的 Arc 浏览器在硅谷极客圈里被誉为"过去五年最酷的浏览器"。
创始人 Josh Miller 最初的想法挺简单:浏览器明明是咱们用得最多的软件,但咋就没人好好做呢? 2019 年的时候,他们就看明白了几个趋势:
他们想打造的是"你在互联网上的家"——为你的工作、生活、每天泡在浏览器里的时光专门设计的地方。他们管这个目标叫"互联网计算机"。
但理想很丰满,现实很骨感。过去十年,多少号称要"颠覆浏览器"的产品最后都凉了。Arc 也没逃过这个命运——即便有百万用户,烧了 1.5 亿美元,The Browser Company 还是宣布不再积极开发新功能了。
Arc 现在咋样了?
Josh Miller 在公开信里说得很明白:
Josh Miller 的三个反思(这哥们太真诚了也):
有意思的是,2024 年 1 月他们展示的"Arc Explore"原型,基本就是现在 Dia 和其他 AI 产品的路子。Josh 说:"不是说我们多有远见,只是直觉早就到了,心还没跟上。"
2024 年春天拿到 5000 万美元融资后,Josh 做了个让业界震惊的决定:彻底放弃 Arc,All-in 做 AI 原生的 Dia。用他的话说:"大家以为我们在造浏览器,其实我们造的是基于浏览器的系统。"
为啥要推倒重来?
根据 Josh 的坦诚反思,Arc 遇到了几个大坑:
"新颖税"太高:对大多数人来说,Arc 太不一样了,学习成本太高,但收益又不够。虽然坚持用几天的都成了死忠粉,但整体数据更像专业工具而不是大众产品。
功能使用率低得吓人:
太实验性了:Arc 太过天马行空,这是它的魅力,但也让它太复杂。相比之下,Dia 的核心功能(跟标签页聊天和个性化)使用率分别达到 40% 和 37%。
改进太小家子气:Josh 承认,Arc 和 Arc Search 虽然有意义,但不够革命性,达不到他们想要的规模突破。
Arc 虽然很酷,但本质上还是"传统浏览器+一点 AI 功能"。而 Dia 是"AI 驱动的浏览环境"。
这个区别很重要:
为啥不把 Dia 的功能加到 Arc 里?
Josh 给了三个理由:
简单粗暴地说:Dia = AI 大脑 + 浏览器外壳
跟 Arc 不一样,Dia 从骨子里就是为 AI 而生的。你别以为就是在浏览器里塞个聊天框那么简单,人家是把 AI 直接融进了地址栏。
关于 ADK - Arc Development Kit(这是理解 Dia 技术优势的关键)
很多人问为啥不开源 Arc?Josh 在公开信里第一次详细解释了原因:
Arc 不只是个 Chromium 分支,它运行在一个叫 ADK 的定制基础架构上。ADK 是他们的"秘密武器"——一个专门用来造浏览器的内部 SDK,特别适合做创新界面的浏览器。这个工具包让前 iOS 工程师能快速做原生浏览器 UI 的原型,根本不用碰 C++。这就是为啥大多数浏览器不敢尝试新东西——成本太高,太复杂,很难脱离 Chrome 的框架。
ADK 也是 Dia 的基础。所以虽然他们很想有一天开源 Arc,但如果不同时开源 ADK,就没啥意义。而 ADK 还是公司的核心竞争力。
1. 地址栏变身 AI 助手
在 Dia 里,地址栏不仅仅是输入网址的地方,它还是你的 AI 助手:
想想看,你不用再开个新标签页去 ChatGPT 了,直接在地址栏就能搞定。
2. 个性化 AI 助手
Dia 提供了超级个性化的设置:
设置好后,AI 会成为你所崇拜对象的"投影",用你熟悉的方式跟你对话。
3. Skills 自定义功能
你可以教 Dia 学会一些个性化的技能:
4. 跨标签页智能整合
你平时研究问题的时候,是不是经常打开一堆标签页?Dia 能帮你:
5. History 时间线功能
Dia 会记录你最近 7 天的浏览行为(当然是在你同意的情况下),然后:
6. 智能写作
当你在收集好对应的页面资料之后,你可以@对应的页签然后打开Dia的写作功能进行AI创作,然后可以一键insert到你鼠标光标的位置
7. 垂直分栏和 Split 功能(多任务处理神器)
这个功能对经常需要对比信息或多任务处理的人来说简直是福音:
比如你可以左边看文档,右边写代码,中间跟 AI 对话,真正实现"一心多用"。
8. 页签置顶功能(重要标签不会丢)
对于经常打开几十个标签的人来说,这个功能太实用了:
这样你常用的邮箱、工作平台、参考文档就不会淹没在标签海洋里了。
9. 垂直标签页设计(继承 Arc 的精髓)
Dia 继承了 Arc 最受欢迎的设计之一——垂直标签页:
10. 标签页搜索功能(标签再多也不怕)
当你打开几十个标签时,找标签就像大海捞针?Dia 的标签搜索功能完美解决这个问题:
这个功能对研究型用户来说简直是救星,再也不用一个个翻找标签了。
11. 网页区块截图功能
遇到下面这个问题可能是 VPN 没开全局
Arc 在早期和公测阶段就用邀请码制度尝到了甜头,Dia 显然延续了这个策略。目前 Dia 还是小范围开放体验。
界面设计:极简到家了
Dia 的主页非常简洁,只有一个搜索框,清爽得有些"不像样"。但这也许正是浏览器最理想的样子:提问、获取答案、结束。没有热搜榜单,不分散你的注意力。
输入问题后,会弹出两个选项:
具体功能体验:
AI 能力:因为目前只支持 Gemini 2.0 和 GPT-4 的模型,在能力上相对有限,目前也不支持自定义模型以及工具拓展,但毕竟 Dia 还处于早期阶段,后续应该会支持更多模型和工具拓展。可以参考下 Cursor,Dia 的 AI 能力应该会逐渐增强。
交互亮点:
实用功能:
用户好评的地方:
跨标签页联动玩法:
类似 ChatGPT 调用 GPTs 的方式,Dia 也支持通过 @ 调用各个网页标签。玩法很朴素但很实用:
目前的问题:
Dia 明显属于第二种,但它的创新在于:
说到 AI 浏览器,现在市面上的玩家还是有很多的!
Arc(2023 年 7 月) - The Browser Company 的第一个作品,推出了 Arc Max,把 AI 功能塞进浏览器里,比如"写下一行"、"给我一个想法"这些功能,算是早期探索。
Dia(2025 年 3 月) - 还是 The Browser Company,基于 ChatGPT 和 Gemini 做了个全新的 AI 原生浏览器,不是"+AI"而是"AI+"的思路。
Manus(2025 年 3 月) - Monica.im 搞的自主 AI 代理,能自己筛简历、分析股票、甚至帮你建网站,真正的 AI 自己干活。
Perplexity Comet - Perplexity AI 已经推出浏览器了,目前内测发布,需要邀请!但看他们搜索做得那么好,浏览器应该也值得期待。
Microsoft Edge(2023 年 2 月) - 微软把 AI 聊天机器人塞进 Edge,能跟网页内容对话,还能帮你写东西,算是大厂里动作最快的。
Deta Surf(2024 年 12 月) - 这个有意思,把浏览器、文件管理器和 AI 助手三合一了,想让你的数字生活都在一个地方搞定。
Opera One(2023 年 6 月) - 搞了个 AI 代理 Aria,能自动化处理任务,还有 AI 标签命令这些功能。
豆包桌面端(2024 年 5 月) - 字节跳动基于 Chromium 做的,不光是浏览器,还是个全能 AI 助手,聊天、写作、翻译、编程啥都能干。
夸克桌面端(2025 年 3 月) - 阿里的"AI 超级框",把 AI 对话、深度搜索、学术研究都整合进去了,用的是自研 AI 模型。
360 AI 浏览器(2024 年 2 月) - 360 接入了 DeepSeek 模型,有 AI 搜索、阅读助手、视频助手这些功能。
Amazon Nova Act(2025 年 3 月) - 亚马逊的通用 AI 代理,能在浏览器里帮你购物、安排任务。
Operator(2025 年 1 月) - OpenAI 的 AI 代理,能自动填表单、预订服务,真正的自动化助手。
百度新搜索(2025 年 6 月) - 百度基于自己的 AI 基建,要推出了新搜索,有 AI 对话、阅读助手、视频助手这些功能。
看出来了吗?大家都在抢这块蛋糕,有的是传统浏览器加 AI,有的是 AI 原生设计,还有的是让 AI 完全接管。这场仗才刚开始打呢!
如果说现在的 Dia 还只是个"聪明的浏览器",那未来的 Dia 可能会成为一个"万能工作台"。
1. 编程能力的深度整合
想象一下,未来的 Dia 可能会:
2. 数据分析师的得力助手
3. 内容创作的超级引擎
4. 工作流自动化平台
5. 研究与学习的智能伙伴
6. 商业决策的参谋
7. 创意设计的灵感源泉
强烈推荐:
可能不太适合:
30 年过去了,浏览器最大的变化可能就是图标。
1990 年,"互联网之父"蒂姆·伯纳斯-李设计的基本交互模式——通过超链接实现网页跳转、输入网址、等待加载、点击链接、回到上一页——这套逻辑到今天还是老样子。都 2025 年了,我们还在用同样的姿势,对着屏幕傻傻地等页面加载。
为啥浏览器 30 年都没咋变?
因为它的设计初衷是围绕"文档"展开的。1989 年,伯纳斯-李在 CERN 工作时创建万维网,就是为了让科学家们方便地共享文档。这个底层逻辑至今没翻篇。
从 Netscape Navigator 到 Chrome、Safari、Firefox,浏览器的核心元素(标签页、地址栏、收藏夹)表面形态变化不大。虽然性能优化了、界面美观了,但说到底还是修修补补。
以前咱们找东西是咋样的?输个关键词,出来一堆结果,然后一个个点进去看,翻来翻去才能找到想要的,贼麻烦。
这就像在图书馆翻书,耗时且低效。在那个年代,找信息本身就是一种技能,甚至催生了"高级搜索技巧"这样的课程。
AI 带来啥变化:
最近老有人提 MCP(Model Context Protocol),这玩意儿到底是啥?
简单说,就是个"万能插头" 你可以把 MCP 想象成家里的插线板,啥电器都能插。这个"插头"让 AI 模型能够轻松连接到各种外部资源:
有了 MCP,AI 助手不光能看数据,还能直接操作数据,比如读文件、改数据库啥的。就像给 AI 装了双手,不光能看,还能干活了。
OpenAI 前 AI 大神 Andrej Karpathy 提出了"LLM 操作系统"的概念,听着挺玄乎,其实就是把 AI 当电脑系统来设计:
在这个框架下,浏览器会继续服务人类,但会越来越适配 AI 的需求。人类下命令,Agent 干活的模式会越来越普遍。
我认为,AI 浏览器不只是个产品机会,而是整个互联网交互方式的革命。
Dia 代表了这场革命的一个重要方向:AI 不是附加功能,而是核心驱动力。它试图回答这样一个问题:如果我们重新设计浏览器,把 AI 从一开始就融入进去,会是什么样?
2010 年,《连线》杂志发表了《Web 已死,Internet 永生》一文,认为 App 会取代 Web。确实,过去十年"App 优先"主导了互联网产品开发。
但生成式 AI 的崛起重新将焦点拉回 Web:
Josh Miller 说:"我们要造一种完全不同类型的浏览器——一个更主动、更强大、更以 AI 为中心的浏览器,可以叫它网络浏览器界的 iPhone,或者'互联网计算机'。"
Josh Miller 更激进的观点:"传统浏览器要完蛋了"
在公开信里,Josh 用了个特别生动的比喻:
"想想看,电灯发明的时候,你还在写文章解释为啥要从蜡烛生意转型。电子智能已经来了——要是还假装它不会彻底改变我们要造的产品,那就太天真了。" 他明确表示:"传统浏览器要死了。就像搜索引擎和 IDE 正在被重新想象一样。这不是说我们不搜索或不写代码了。只是说我们做这些事的环境会完全不一样,让传统浏览器、搜索引擎和 IDE 看起来像蜡烛一样过时——不管做得多精致。我们要退出蜡烛生意。你也应该这样。" 他看到了三个关键变化:
在早期演示里,Dia 展示了浏览器怎么代表人类执行任务。比如,Dia 自己浏览亚马逊,找到商品并加到购物车。这正是浏览器能做的——利用它对你所有 Web 应用和浏览数据的访问权限,替你完成任务。
从目前的体验来看,Dia 确实带来了一些让人眼前一亮的创新。它不仅继承了 Arc 的优秀设计(如垂直标签页),还加入了个性化 AI 助手、Skills 功能、跨标签页信息整合等创新功能,这些都是传统浏览器很难做到的。
但作为一个 beta 产品,它还有很多需要完善的地方。最大的挑战是如何平衡创新与易用性,如何在保护隐私的同时提供个性化服务。尽管如今的 Dia 距离这一目标尚有差距,但这种从被动响应到主动执行理念的转变,却与当下大火的 Agent 不谋而合。
未来的浏览器可能不再是"浏览"网页的工具,而是 AI 帮你"处理"网络信息的平台。
说说你的看法!这场 AI 浏览器的战争,才刚刚开始。
Tips:想体验 Dia 的话,可以先去官网 diabrowser.com 排队申请,或者找个已经有权限的朋友(比如我)邀请你。
本文作者:Rose
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!