Dia 浏览器解析与思考
2025-07-11
AI
00

目录

开篇:一个有意思的现象
第一部分:浏览器是 AI 时代的"总入口"
先说个大背景
为啥浏览器对 AI 这么重要?
第二部分:深度解析 Dia——AI 原生浏览器的标杆
The Browser Company 的"豪赌"
Dia 是什么?
Dia 的核心创新点
怎么玩转 Dia?实测体验来了
第一步:搞到体验资格
第二步:简单设置一下
第三步:玩起来
实际用起来咋样?
AI 浏览器的三种玩法,哪种更靠谱?
玩法 1:传统浏览器加个 AI 插件
玩法 2:AI 深度融合的浏览器
玩法 3:专门给 AI 用的浏览器
Dia 属于哪种?
和其他产品比比看
跟 Chrome 比
跟 Arc 比
跟豆包/夸克桌面端比
跟 Manus 比
市面上都有哪些玩家在做 AI 浏览器?
隐私这事儿咋整?
Dia 是怎么保护隐私的
可能的风险
接下来会咋样?
Dia 能变成啥样?从浏览器到"万能工作台"【这块内容是 Dia 的 AI 给的 😁】
哪些人适合用 Dia?
浏览器终于要变天了
30 年没变的浏览器,这回真要变了
从"人点鼠标找信息"到"AI 直接拿数据"
MCP 协议:给 AI 装个"万能插头"
LLM 操作系统是个啥概念?
总结:这不光是产品升级,是交互方式的革命
Web 死了?不,Web 要重生了
Dia 想干啥:从浏览器变成"互联网计算机"
你咋看?

"AI won't exist as an app. Or a button. It'll be an entirely new environment — built on top of a web browser."—— Dia Browser

开篇:一个有意思的现象

你们发现没有,最近几乎所有的 AI 大厂都在做浏览器:

  • 字节跳动:豆包桌面端就是浏览器
  • 阿里:夸克桌面端也是浏览器形态
  • OpenAI:传言在做浏览器产品
  • Perplexity:刚刚最新发布了自己的浏览器 Comet 测评视频

image.png

image.png

  • The Browser Company:从 Arc 转向 AI 原生的 Dia
  • 百度:新搜索

image.png

image.png

连 Claude 的桌面端都是基于 Chromium 的!

这背后到底发生了什么?为什么大家都盯上了浏览器?

第一部分:浏览器是 AI 时代的"总入口"

先说个大背景

你想想,你每天上网干啥?

  • 看新闻、刷社交媒体
  • 写邮件、做文档
  • 看视频、听音乐
  • 网购、订外卖
  • 工作、学习、娱乐

所有这些,都在浏览器里完成。

这就是为什么 Chrome 能统治互联网这么多年——它掌握了流量入口。而在 AI 时代,谁掌握了浏览器,谁就掌握了 AI 应用的最佳场景。

image.png

为啥浏览器对 AI 这么重要?

1. 上下文就是金矿

在 AI 时代,上下文就是一切。浏览器天然拥有:

  • 用户的浏览历史
  • 当前打开的所有标签页
  • 用户的操作习惯
  • 各种网站的登录状态

这些信息对 AI 来说,就是理解用户意图的"宝藏"。

image.png 2. 浏览器是 AI Agent 的最佳载体

想象一下 AI Agent 能做什么:

  • 帮你比价购物
  • 自动回复邮件
  • 整理研究资料
  • 预定餐厅、酒店
  • 处理工作流程

这些任务,80%都要在浏览器里完成。

3. 绕开应用商店这道坎

做手机 App 要受苹果、谷歌的限制,但浏览器不用。你可以:

  • 直接接入用户的工作流
  • 不用担心应用商店的审核
  • 更自由地实现 AI 功能

第二部分:深度解析 Dia——AI 原生浏览器的标杆

The Browser Company 的"豪赌"

先说说背景:The Browser Company 成立于 2019 年,累计融资 1.28 亿美元,估值超过 5.5 亿美元。他们的 Arc 浏览器在硅谷极客圈里被誉为"过去五年最酷的浏览器"。

创始人 Josh Miller 最初的想法挺简单:浏览器明明是咱们用得最多的软件,但咋就没人好好做呢? 2019 年的时候,他们就看明白了几个趋势:

  • 啥都在往浏览器里搬(他老婆整天在 Chrome 里办公,6 岁的小侄女在网页上学)
  • 云服务赚得盆满钵满,牛逼的创业公司都是做网页的
  • 但 Chrome 和 Safari 还跟咱们小时候用的一样,一点都没跟上时代

他们想打造的是"你在互联网上的家"——为你的工作、生活、每天泡在浏览器里的时光专门设计的地方。他们管这个目标叫"互联网计算机"。

但理想很丰满,现实很骨感。过去十年,多少号称要"颠覆浏览器"的产品最后都凉了。Arc 也没逃过这个命运——即便有百万用户,烧了 1.5 亿美元,The Browser Company 还是宣布不再积极开发新功能了。

Arc 现在咋样了?

Josh Miller 在公开信里说得很明白:

  • Arc 不会关,他们知道很多人还在用,团队的家人朋友也在用
  • 会继续维护:定期更新 Chromium、修复安全漏洞和 bug
  • 大部分人甚至都没发现他们停止开发新功能了——这说明大家要的是稳定,不是花里胡哨的新玩意儿
  • 如果以后有机会,在不影响团队和股东利益的情况下,他们很乐意开源 Arc
  • Josh 欢迎大家给 Arc 的未来提建议

Josh Miller 的三个反思(这哥们太真诚了也):

  1. "我早该停止 Arc 的开发"——其实数据早就告诉他们增长不行了,但就是不愿意承认,一直在自欺欺人。
  2. "我应该更早拥抱 AI"——Josh 说他其实特痴迷 AI,家人睡了后还熬夜玩 ChatGPT。但他觉得行业炒作太过了,不好意思表现出来,结果压抑了自己的好奇心。从他们小心翼翼推出 Arc Max 就能看出来。

有意思的是,2024 年 1 月他们展示的"Arc Explore"原型,基本就是现在 Dia 和其他 AI 产品的路子。Josh 说:"不是说我们多有远见,只是直觉早就到了,心还没跟上。"

  1. "我的沟通有大问题"——有时候太透明(细节还没定就宣布 Dia),有时候又不够透明(老半天才回答大家关心的问题)。

2024 年春天拿到 5000 万美元融资后,Josh 做了个让业界震惊的决定:彻底放弃 Arc,All-in 做 AI 原生的 Dia。用他的话说:"大家以为我们在造浏览器,其实我们造的是基于浏览器的系统。"

为啥要推倒重来?

根据 Josh 的坦诚反思,Arc 遇到了几个大坑:

  1. "新颖税"太高:对大多数人来说,Arc 太不一样了,学习成本太高,但收益又不够。虽然坚持用几天的都成了死忠粉,但整体数据更像专业工具而不是大众产品。

  2. 功能使用率低得吓人

    • 只有 5.52% 的日活用户会经常用多个 Space
    • 只有 4.17% 用 Live Folders(包括 GitHub Live Folders)
    • Calendar Preview on Hover 这个团队最爱的功能,使用率才 0.4%
  3. 太实验性了:Arc 太过天马行空,这是它的魅力,但也让它太复杂。相比之下,Dia 的核心功能(跟标签页聊天和个性化)使用率分别达到 40% 和 37%。

  4. 改进太小家子气:Josh 承认,Arc 和 Arc Search 虽然有意义,但不够革命性,达不到他们想要的规模突破。

Arc 虽然很酷,但本质上还是"传统浏览器+一点 AI 功能"。而 Dia 是"AI 驱动的浏览环境"。

这个区别很重要:

  • Arc: 你用浏览器,AI 帮你(+AI)
  • Dia: AI 理解你,浏览器配合 AI(AI+)

为啥不把 Dia 的功能加到 Arc 里?

Josh 给了三个理由:

  1. 简单比新颖重要:苹果前高管 Scott Forstall 跟他们说,Arc 像萨克斯管——很牛但难学。然后挑战他们:把它做成钢琴,谁都能坐下来就弹的那种。这就是 Dia 的理念:把复杂藏在熟悉的界面后面。
  2. 速度不是选择题,是必答题:Dia 的架构贼快。真的贼快。Arc 太臃肿了,他们加了太多东西,太快了。Dia 从头开始重新设计架构,一开始就把性能放第一位。具体来说,不用 TCA 和 SwiftUI 了,让 Dia 轻量、敏捷、响应快。
  3. 安全必须搞好:Dia 是个不一样的产品——为了它,他们把安全团队从 1 人扩到 5 人。投资做红队测试、漏洞赏金和内部审计。他们的目标是给小创业公司树立标准。在 AI 世界里,这更重要了,特别是更多 AI 代理上线后。

Dia 是什么?

简单粗暴地说:Dia = AI 大脑 + 浏览器外壳

跟 Arc 不一样,Dia 从骨子里就是为 AI 而生的。你别以为就是在浏览器里塞个聊天框那么简单,人家是把 AI 直接融进了地址栏。

  • 表面上看:Dia 是一款同时集成了 GPT-4 与 Gemini 2.0 Flash 的多模态 AI 浏览器,支持个性化对话、视频分析与多任务处理,并且免费、无使用限制。
  • 实际上:这是对浏览器交互逻辑的重新设计。
  • 技术基础:基于 Chromium 引擎的特定版本构建,但更重要的是,它建立在 The Browser Company 的核心技术 ADK(Arc Development Kit)之上。

关于 ADK - Arc Development Kit(这是理解 Dia 技术优势的关键)

很多人问为啥不开源 Arc?Josh 在公开信里第一次详细解释了原因:

Arc 不只是个 Chromium 分支,它运行在一个叫 ADK 的定制基础架构上。ADK 是他们的"秘密武器"——一个专门用来造浏览器的内部 SDK,特别适合做创新界面的浏览器。这个工具包让前 iOS 工程师能快速做原生浏览器 UI 的原型,根本不用碰 C++。这就是为啥大多数浏览器不敢尝试新东西——成本太高,太复杂,很难脱离 Chrome 的框架。

ADK 也是 Dia 的基础。所以虽然他们很想有一天开源 Arc,但如果不同时开源 ADK,就没啥意义。而 ADK 还是公司的核心竞争力。

Dia 的核心创新点

1. 地址栏变身 AI 助手

在 Dia 里,地址栏不仅仅是输入网址的地方,它还是你的 AI 助手:

  • 可以直接问问题:"今天天气咋样?"
  • 让它总结当前网页内容
  • 帮你写邮件草稿
  • 甚至能自动在亚马逊购物车里加东西

想想看,你不用再开个新标签页去 ChatGPT 了,直接在地址栏就能搞定。

image.png 2. 个性化 AI 助手

Dia 提供了超级个性化的设置:

  • 可以选择 AI 的"偶像"(比如乔布斯、《纽约时报》的风格)
  • 可以设置你自己的学习方式
  • 写作技巧、风格
  • 如何用自己喜欢的风格起草草稿
  • 代码生成风格(比如 Golang 代码风格)

设置好后,AI 会成为你所崇拜对象的"投影",用你熟悉的方式跟你对话。

image.png

3. Skills 自定义功能

你可以教 Dia 学会一些个性化的技能:

  • 论文翻译
  • 自动提取 Google Sheets 中的数据
  • 执行特定的网页操作
  • 根据你的需求定制响应方式(比如写邮件)

image.png 4. 跨标签页智能整合

你平时研究问题的时候,是不是经常打开一堆标签页?Dia 能帮你:

  • 自动分析你打开的所有标签页
  • 找出不同网站信息的共同点和矛盾
  • 基于多个网页内容写报告
  • 回答跨标签页的复杂问题

image.png

image.png

5. History 时间线功能

Dia 会记录你最近 7 天的浏览行为(当然是在你同意的情况下),然后:

  • 你可以问它:"我昨天看的那个关于 Python 的文章在哪?"
  • 它能根据你的浏览历史提供个性化建议
  • 帮你找到之前看过但忘记收藏的内容

image.png

6. 智能写作

当你在收集好对应的页面资料之后,你可以@对应的页签然后打开Dia的写作功能进行AI创作,然后可以一键insert到你鼠标光标的位置

image.png

7. 垂直分栏和 Split 功能(多任务处理神器)

这个功能对经常需要对比信息或多任务处理的人来说简直是福音:

  • 垂直分栏:支持将浏览器窗口垂直分成多栏,每栏都可以独立浏览不同的网页
  • Split View:通过"View 菜单-Add Split View Pane",可以快速分屏,最多支持 4 块屏幕同时显示
  • 灵活调整:可以自由拖拽调整每个分栏的宽度,根据需求分配屏幕空间
  • 独立操作:每个分栏都有独立的地址栏和导航,互不干扰

比如你可以左边看文档,右边写代码,中间跟 AI 对话,真正实现"一心多用"。

image.png 8. 页签置顶功能(重要标签不会丢)

对于经常打开几十个标签的人来说,这个功能太实用了:

  • 一键置顶:右键点击标签,选择"Pin Tab"即可将重要标签固定在最前面
  • 视觉区分:置顶的标签会变小并固定在标签栏最左侧,一眼就能找到
  • 持久保存:即使关闭浏览器,下次打开时置顶的标签还在原位
  • 快速切换:可以用快捷键在置顶标签间快速切换

这样你常用的邮箱、工作平台、参考文档就不会淹没在标签海洋里了。

image.png

9. 垂直标签页设计(继承 Arc 的精髓)

Dia 继承了 Arc 最受欢迎的设计之一——垂直标签页:

  • 空间利用更合理:现在的屏幕都是宽屏,垂直排列能更好地利用横向空间
  • 标签显示更完整:不会像横向标签那样被压缩,能看到更多标题信息
  • 层级管理:支持标签分组和折叠,让相关标签聚在一起
  • 视觉层次清晰:通过缩进和分组,一眼就能看出标签之间的关系

image.png

10. 标签页搜索功能(标签再多也不怕)

当你打开几十个标签时,找标签就像大海捞针?Dia 的标签搜索功能完美解决这个问题:

  • 快速搜索:在垂直标签栏顶部有搜索框,输入关键词即可快速定位
  • 智能匹配:不仅匹配标题,还能搜索网页内容
  • 实时过滤:输入时实时显示匹配结果,不匹配的标签会暂时隐藏
  • 快捷键支持:可以用快捷键快速激活搜索,效率更高

这个功能对研究型用户来说简直是救星,再也不用一个个翻找标签了。

image.png 11. 网页区块截图功能

iShot_2025-07-10_12.49.41 (1).gif

怎么玩转 Dia?实测体验来了

第一步:搞到体验资格

  • 硬件要求:仅支持配备 Mac M1 芯片以及更高版本的 macOS 14+(Windows/Linux 用户暂时不支持)
  • 获取方式: - 先去官网 diabrowser.com/download 下载 - 打开后会出一个贼炫酷的 landing 动画 - 然后是注册环节——这里有门槛: - 只支持老 Arc 用户账号登录 - 或者有邀请的邮箱才能注册 - 现有用户可以邀请朋友(5 个名额)

xxxx.gif 遇到下面这个问题可能是 VPN 没开全局

image.png

Arc 在早期和公测阶段就用邀请码制度尝到了甜头,Dia 显然延续了这个策略。目前 Dia 还是小范围开放体验。

第二步:简单设置一下

  • 安装过程:基于 Chromium,所以界面看起来很熟悉
  • 个性化设置
    • 选择 AI 的"偶像"和风格
    • 设置回答的详细程度
    • 选择是否开启 History 功能

第三步:玩起来

  • 在地址栏输入问题试试
  • 让它总结当前网页
  • 体验 Skills 自定义功能
  • 测试跨标签页问答

实际用起来咋样?

界面设计:极简到家了

Dia 的主页非常简洁,只有一个搜索框,清爽得有些"不像样"。但这也许正是浏览器最理想的样子:提问、获取答案、结束。没有热搜榜单,不分散你的注意力。

输入问题后,会弹出两个选项:

  • Google:直接跳转到传统搜索引擎
  • Chat:调用 Dia 的 AI 助手直接回答

具体功能体验:

  1. AI 能力:因为目前只支持 Gemini 2.0 和 GPT-4 的模型,在能力上相对有限,目前也不支持自定义模型以及工具拓展,但毕竟 Dia 还处于早期阶段,后续应该会支持更多模型和工具拓展。可以参考下 Cursor,Dia 的 AI 能力应该会逐渐增强。

  2. 交互亮点

    • 划词后右侧直接提供查找或解释功能
    • 光标放到输入框会变蓝变粗,点击自动调出 AI 助手
    • 能理解上下文,比如在知乎评论区写评论,它会读完整个页面后给出贴合知乎风格的评论建议
  3. 实用功能

    • 上传梗图能识别言外之意
    • 10 万字文档总结很到位(但限制 100M,不支持 Doc 格式)
    • 视频总结功能不错,还能提取字幕
    • 支持分屏浏览(最多 4 块),适合多任务处理
    • 标签页可以通过 @ 调用,实现多页面信息联动

用户好评的地方:

  • 界面设计:从"复杂极客工具"变成"极简 AI 入口"
  • AI 响应:对话式搜索很自然,理解能力不错
  • 个性化:真的能感受到 AI 的"个性"
  • 实用性强:很多用户反映在写邮件、处理 Google Sheets 时特别好用
  • 书签迁移:吸取 Arc 教训,支持一键导入 Chrome 书签
  • 垂直标签页:继承了 Arc 的经典设计,标签页垂直排列在侧边栏

跨标签页联动玩法:

类似 ChatGPT 调用 GPTs 的方式,Dia 也支持通过 @ 调用各个网页标签。玩法很朴素但很实用:

  • 我挑选了过往几篇关于 Ai Native 的文章
  • 在 AI 对话框中输入 @ 就能看到所有打开的标签
  • 选择需要的标签,让 AI 总结"Ai Native 值得吐槽的点"
  • 很快就得到了基于多篇文章的清晰答案

目前的问题:

  • 扩展兼容性:可能有些 Chrome 扩展兼容性不行
  • 平台限制:只支持 macOS
  • 还是半成品:距离 Josh Miller 描述的"互联网计算机"愿景还有差距

AI 浏览器的三种玩法,哪种更靠谱?

玩法 1:传统浏览器加个 AI 插件

  • 代表选手:Chrome + Monica 插件、Edge + Copilot
  • 优点:用户熟悉,上手容易
  • 缺点:AI 功能有限,体验割裂

玩法 2:AI 深度融合的浏览器

  • 代表选手:Dia、豆包桌面端、夸克桌面端
  • 优点:AI 权限更大,体验更好
  • 缺点:需要用户改变使用习惯

玩法 3:专门给 AI 用的浏览器

  • 代表选手:Manus
  • 优点:AI 操作能力最强
  • 缺点:学习成本高,适用场景窄

Dia 属于哪种?

Dia 明显属于第二种,但它的创新在于:

  • 不是简单的 AI 功能堆砌
  • 而是重新设计了浏览器的交互逻辑
  • 让 AI 成为浏览器的"底层能力"

和其他产品比比看

跟 Chrome 比

  • Chrome 的 AI 功能主要通过扩展实现
  • Dia 的 AI 是原生集成,体验更流畅
  • Chrome 扩展生态更丰富,Dia 刚起步

跟 Arc 比

  • Arc 注重界面创新和自定义
  • Dia 注重 AI 自动化和效率
  • Dia 继承了 Arc 的垂直标签页设计,但加入了更多 AI 功能

跟豆包/夸克桌面端比

  • 豆包/夸克用户量大,功能全面
  • Dia 更专注于浏览器场景的 AI 体验
  • 豆包/夸克是大厂 AI to C 的重点产品

跟 Manus 比

  • Manus 让 AI 操作浏览器,人机分离
  • Dia 让人和 AI 共同使用浏览器
  • 两种哲学代表了 AI 浏览器的不同方向

市面上都有哪些玩家在做 AI 浏览器?

说到 AI 浏览器,现在市面上的玩家还是有很多的!

Arc(2023 年 7 月) - The Browser Company 的第一个作品,推出了 Arc Max,把 AI 功能塞进浏览器里,比如"写下一行"、"给我一个想法"这些功能,算是早期探索。

Dia(2025 年 3 月) - 还是 The Browser Company,基于 ChatGPT 和 Gemini 做了个全新的 AI 原生浏览器,不是"+AI"而是"AI+"的思路。

Manus(2025 年 3 月) - Monica.im 搞的自主 AI 代理,能自己筛简历、分析股票、甚至帮你建网站,真正的 AI 自己干活。

Perplexity Comet - Perplexity AI 已经推出浏览器了,目前内测发布,需要邀请!但看他们搜索做得那么好,浏览器应该也值得期待。

Microsoft Edge(2023 年 2 月) - 微软把 AI 聊天机器人塞进 Edge,能跟网页内容对话,还能帮你写东西,算是大厂里动作最快的。

Deta Surf(2024 年 12 月) - 这个有意思,把浏览器、文件管理器和 AI 助手三合一了,想让你的数字生活都在一个地方搞定。

Opera One(2023 年 6 月) - 搞了个 AI 代理 Aria,能自动化处理任务,还有 AI 标签命令这些功能。

豆包桌面端(2024 年 5 月) - 字节跳动基于 Chromium 做的,不光是浏览器,还是个全能 AI 助手,聊天、写作、翻译、编程啥都能干。

夸克桌面端(2025 年 3 月) - 阿里的"AI 超级框",把 AI 对话、深度搜索、学术研究都整合进去了,用的是自研 AI 模型。

360 AI 浏览器(2024 年 2 月) - 360 接入了 DeepSeek 模型,有 AI 搜索、阅读助手、视频助手这些功能。

Amazon Nova Act(2025 年 3 月) - 亚马逊的通用 AI 代理,能在浏览器里帮你购物、安排任务。

Operator(2025 年 1 月) - OpenAI 的 AI 代理,能自动填表单、预订服务,真正的自动化助手。

百度新搜索(2025 年 6 月) - 百度基于自己的 AI 基建,要推出了新搜索,有 AI 对话、阅读助手、视频助手这些功能。

看出来了吗?大家都在抢这块蛋糕,有的是传统浏览器加 AI,有的是 AI 原生设计,还有的是让 AI 完全接管。这场仗才刚开始打呢!

隐私这事儿咋整?

Dia 是怎么保护隐私的

  • 本地优先:大部分数据存在本地,不上传云端
  • 最小化传输:只有必要的信息才会发送给 AI 服务商
  • 透明度高:清楚告诉你哪些数据被使用了
  • 用户说了算:可以随时关闭 History 功能,清除数据
  • 30 天自动删:云端数据 30 天后自动删除

可能的风险

  • AI 可能会"看到"敏感页面内容
  • 浏览历史被用于个性化推荐
  • 存在数据泄露的风险(虽然很小)

接下来会咋样?

Dia 能变成啥样?从浏览器到"万能工作台"【这块内容是 Dia 的 AI 给的 😁】

如果说现在的 Dia 还只是个"聪明的浏览器",那未来的 Dia 可能会成为一个"万能工作台"。

1. 编程能力的深度整合

想象一下,未来的 Dia 可能会:

  • 实时代码执行:直接在浏览器里写代码,AI 帮你调试、运行、部署
  • 跨语言翻译:看到 Python 代码,一键转成 JavaScript,还能保证逻辑正确
  • API 自动调用:告诉 AI "帮我从这个网站获取数据",它自动分析 API、编写代码、执行请求
  • 代码可视化:复杂的算法和数据结构,AI 自动生成交互式图表帮你理解

2. 数据分析师的得力助手

  • 智能数据抓取:不需要写爬虫,AI 自动识别网页数据结构,一键提取成表格
  • 实时数据分析:打开任何包含数据的网页,AI 自动生成统计图表和洞察报告
  • 跨网站数据整合:同时打开多个数据源,AI 自动对齐、清洗、合并数据
  • 预测建模:基于历史数据,AI 直接在浏览器里训练模型、做预测

3. 内容创作的超级引擎

  • 多模态内容生成:看着网页内容,AI 自动生成配图、视频脚本、播客大纲
  • 风格迁移:把任何文章改写成你喜欢的风格——学术论文秒变科普文章
  • 实时翻译创作:一边浏览外文网站,一边生成本地化的创作内容
  • 素材智能整合:从多个网页收集素材,AI 自动整理成结构化的创作大纲

4. 工作流自动化平台

  • 跨平台任务串联:在 Gmail 收到邮件 → 自动提取信息 → 更新 Google Sheets→ 发送 Slack 通知
  • 智能表单填写:AI 记住你的信息,自动填写各种网站的表单,还能处理验证码
  • 批量操作助手:需要在 100 个网页做相同操作?告诉 AI 一次,剩下的它来完成
  • 定时任务管理:设置"每天早上帮我检查这 5 个网站的更新并总结"

5. 研究与学习的智能伙伴

  • 知识图谱构建:浏览相关主题时,AI 自动构建知识关系图,帮你理清脉络
  • 论文阅读助手:打开 PDF,AI 自动提取关键观点、生成思维导图、关联相关研究
  • 学习路径规划:告诉 AI 你想学什么,它基于你的浏览历史定制个性化学习计划
  • 实时问答辅导:看不懂的内容随时问,AI 结合上下文给出详细解释

6. 商业决策的参谋

  • 竞品监控:自动追踪竞争对手网站变化,生成对比分析报告
  • 市场情报收集:从多个来源汇总行业动态,提炼关键洞察
  • 用户反馈分析:自动收集各平台的用户评论,做情感分析和需求提取
  • 投资研究助手:整合财报、新闻、社交媒体,生成投资建议

7. 创意设计的灵感源泉

  • 设计元素提取:看到喜欢的网页设计,AI 自动提取配色、字体、布局方案
  • 原型快速生成:描述你的想法,AI 直接在浏览器里生成可交互的原型
  • 设计趋势分析:浏览设计网站时,AI 实时分析流行趋势和创新点
  • 素材智能推荐:基于你的项目需求,AI 主动推荐相关的设计资源

哪些人适合用 Dia?

强烈推荐:

  • 经常需要研究和整理信息的人
  • 喜欢尝试新技术的 early adopters
  • 对 AI 辅助工作感兴趣的用户
  • 重视隐私但又想用 AI 的人
  • 经常需要处理文档、邮件的知识工作者

可能不太适合:

  • 重度依赖 Chrome 扩展的用户
  • 对 AI 功能没需求的传统用户
  • 使用 Windows/Linux 的用户

浏览器终于要变天了

30 年没变的浏览器,这回真要变了

30 年过去了,浏览器最大的变化可能就是图标。

1990 年,"互联网之父"蒂姆·伯纳斯-李设计的基本交互模式——通过超链接实现网页跳转、输入网址、等待加载、点击链接、回到上一页——这套逻辑到今天还是老样子。都 2025 年了,我们还在用同样的姿势,对着屏幕傻傻地等页面加载。

为啥浏览器 30 年都没咋变?

因为它的设计初衷是围绕"文档"展开的。1989 年,伯纳斯-李在 CERN 工作时创建万维网,就是为了让科学家们方便地共享文档。这个底层逻辑至今没翻篇。

从 Netscape Navigator 到 Chrome、Safari、Firefox,浏览器的核心元素(标签页、地址栏、收藏夹)表面形态变化不大。虽然性能优化了、界面美观了,但说到底还是修修补补。

从"人点鼠标找信息"到"AI 直接拿数据"

以前咱们找东西是咋样的?输个关键词,出来一堆结果,然后一个个点进去看,翻来翻去才能找到想要的,贼麻烦。

这就像在图书馆翻书,耗时且低效。在那个年代,找信息本身就是一种技能,甚至催生了"高级搜索技巧"这样的课程。

AI 带来啥变化:

  • 过去:浏览器服务人类,依赖 UI 自动化工具(如 Selenium)模拟人类操作
  • 现在:AI Agent 需要通过代码直接访问数据,跳过视觉交互
  • 未来:通过标准化协议(如 MCP)实现"机器 → 协议 → 数据"的直连

MCP 协议:给 AI 装个"万能插头"

最近老有人提 MCP(Model Context Protocol),这玩意儿到底是啥?

简单说,就是个"万能插头" 你可以把 MCP 想象成家里的插线板,啥电器都能插。这个"插头"让 AI 模型能够轻松连接到各种外部资源:

  • 文件系统
  • 数据库
  • 在线服务
  • 各种 API

有了 MCP,AI 助手不光能看数据,还能直接操作数据,比如读文件、改数据库啥的。就像给 AI 装了双手,不光能看,还能干活了。

LLM 操作系统是个啥概念?

OpenAI 前 AI 大神 Andrej Karpathy 提出了"LLM 操作系统"的概念,听着挺玄乎,其实就是把 AI 当电脑系统来设计:

  • LLM 当 CPU:AI 模型就是处理核心
  • 上下文窗口当内存:能记住多少对话
  • 向量数据库当硬盘:长期存储信息
  • 浏览器当显示器:展示和交互的界面
  • 各种工具当外设:处理图片、音频、视频

在这个框架下,浏览器会继续服务人类,但会越来越适配 AI 的需求。人类下命令,Agent 干活的模式会越来越普遍。

总结:这不光是产品升级,是交互方式的革命

我认为,AI 浏览器不只是个产品机会,而是整个互联网交互方式的革命。

Dia 代表了这场革命的一个重要方向:AI 不是附加功能,而是核心驱动力。它试图回答这样一个问题:如果我们重新设计浏览器,把 AI 从一开始就融入进去,会是什么样?

Web 死了?不,Web 要重生了

2010 年,《连线》杂志发表了《Web 已死,Internet 永生》一文,认为 App 会取代 Web。确实,过去十年"App 优先"主导了互联网产品开发。

但生成式 AI 的崛起重新将焦点拉回 Web:

  • AI 交互本质上以文本/对话为核心,Web 界面天然支持
  • AI 模型计算需求大、迭代快,Web 平台能以最小成本覆盖所有设备
  • 相比下载 App,Web 版本"即点即用",降低了用户尝试门槛

Dia 想干啥:从浏览器变成"互联网计算机"

Josh Miller 说:"我们要造一种完全不同类型的浏览器——一个更主动、更强大、更以 AI 为中心的浏览器,可以叫它网络浏览器界的 iPhone,或者'互联网计算机'。"

Josh Miller 更激进的观点:"传统浏览器要完蛋了"

在公开信里,Josh 用了个特别生动的比喻:

"想想看,电灯发明的时候,你还在写文章解释为啥要从蜡烛生意转型。电子智能已经来了——要是还假装它不会彻底改变我们要造的产品,那就太天真了。" 他明确表示:"传统浏览器要死了。就像搜索引擎和 IDE 正在被重新想象一样。这不是说我们不搜索或不写代码了。只是说我们做这些事的环境会完全不一样,让传统浏览器、搜索引擎和 IDE 看起来像蜡烛一样过时——不管做得多精致。我们要退出蜡烛生意。你也应该这样。" 他看到了三个关键变化:

  1. 网页不再是主要界面:传统浏览器是为加载网页造的。但越来越多的网页——应用、文章和文件——会变成 AI 聊天界面的工具调用。聊天界面已经像浏览器一样运作了:它们搜索、阅读、生成、响应。
  2. Web 不会消失,但会被整合:Figma 和《纽约时报》不会变得不重要。你老板不会放弃团队的 SaaS 工具。我们还是要编辑文档、看视频、读周末文章。网页不会被取代——它们还是必不可少的。我们的标签页不是可有可无的,它们是我们的核心上下文。
  3. 新界面从熟悉的开始:就像 iPhone 把旧东西组合成全新的东西一样,AI 浏览器也会这样。Cursor 在编程领域证明了这点:过去一年最突破的 AI 应用是个(旧的)IDE——为 AI 原生设计的。

在早期演示里,Dia 展示了浏览器怎么代表人类执行任务。比如,Dia 自己浏览亚马逊,找到商品并加到购物车。这正是浏览器能做的——利用它对你所有 Web 应用和浏览数据的访问权限,替你完成任务。

从目前的体验来看,Dia 确实带来了一些让人眼前一亮的创新。它不仅继承了 Arc 的优秀设计(如垂直标签页),还加入了个性化 AI 助手、Skills 功能、跨标签页信息整合等创新功能,这些都是传统浏览器很难做到的。

但作为一个 beta 产品,它还有很多需要完善的地方。最大的挑战是如何平衡创新与易用性,如何在保护隐私的同时提供个性化服务。尽管如今的 Dia 距离这一目标尚有差距,但这种从被动响应到主动执行理念的转变,却与当下大火的 Agent 不谋而合。

未来的浏览器可能不再是"浏览"网页的工具,而是 AI 帮你"处理"网络信息的平台。

你咋看?

  • 你会为了 AI 功能换浏览器吗?
  • 你更看好哪种 AI 浏览器形态?
  • Dia 这种 AI 原生的设计会成为主流吗?

说说你的看法!这场 AI 浏览器的战争,才刚刚开始。

Tips:想体验 Dia 的话,可以先去官网 diabrowser.com 排队申请,或者找个已经有权限的朋友(比如我)邀请你。

本文作者:Rose

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!