问大家个问题:AI已经火了两年了,各类AI产品也不少,但你身边真的在工作学习中用上AI的人有多少?

  除了地区限制和付费订阅外,还有个问题是,我们的工作流程已经有小十年没迭代过了,积习难改。现有的AI产品不好融入我们习惯的工作流,懒得去改工作习惯,一拖再拖。

  于是,现在AI产品面对的问题不再是AI是“人工智障”,而是如何制造一个“杀手级”应用,让除了开发者和早期采纳者之外的大众用户无痛用上AI。

  今年5月20日,微软Build 2024开发者大会上,微软宣布在新款电脑上加入一个copilot键,可以一键调用AI功能,AIPC的概念让微软的股价高涨,一度逼近历史高位。

  一个月后,苹果WWDC发布了Apple Intelligence,提出个人智能(personal intellegence)的概念,要做“全新个人化人工智能”。在苹果看来,再强大的AI工具,如果不能理解用户身处的情境,和用户的生活交融,就无法发挥最大的能力——换句话说,不能个人化的智能,再智能也白搭。

  市面上不乏让人眼前一亮的聊天工具,能利用全世界的知识执行大量任务,但它们很少能跟我们的工作习惯交融,最终沦为教辅用品和聊天工具。

  AIPC和AI应用最大的不同就在于,AIPC是给电脑原有的功能加上了AI入口,而AI应用是先有需求再去找各种各样的应用解决相应的问题。有市场分析师认为,未来内置AI的电脑将会是必需品。

  那有没有一种办法,不用很累很麻烦就能把自己的老电脑升级成“AIPC”,真正让AI变成生产力?

  自从AI热潮席卷社交媒体,就连我爹都对它能干啥一清二楚,当知道它能写稿能收集资料回答提问,我爹对我发出了灵魂拷问:你现在上班是不是只要复制粘贴就可以了?那你是不是很快失业了?

  日常工作中需要查资料、读论文,还需要在短时间内提炼重点,消化之后再输出自己的观点。为了用上AI,我必须打开两个ChatGPT网页版(一个用来处理图片一个用来处理文字)、网页本身、word、pdf、音频转写AI,浏览器经常卡死,有时候觉得这个AI咱是非用不可吗?更别提有些资料是图片格式的,无法复制,只能先截图识别,再手动复制进去。

  工作中一半时间在AI应用和办公软件间左右横跳,至此我完全变成了“AI的搬运工”。

  豆包电脑版跟GPT-4o新推出的的桌面App差不多,主打一个与电脑功能无缝衔接。豆包电脑版以“豆包”主智能体为核心,集合了搜、读、写、绘四类功能,比起网页版AI入口真是清爽了太多。

  无论是在桌面还是在任何应用中,只要按下快捷键就能随时在画面中央召唤出对话框,进行提问、AI搜索或使用更多功能。

  日常阅读文献时,也不用再复制或者重新手打问题了(pdf经常复制不了,小语种有时也无法打出来),安装了电脑版豆包之后,用鼠标在文档中选中,会自动出现划词功能。

  之后,不管是选择搜索、翻译还是解释,甚至是解释之后追问,都很好用。还能一键插入原文,我连复制粘贴工具人都不用当了,点一点直接完成工作。

  之前写邮件也要分很多步:先打开AI网页,写出指令,邮件生成后再进行删改润色,之后再次复制到邮箱里发送。其实已经对我这种写正式邮件头疼的人很友好了。

  直到有一次我用ChatGPT写正式邮件,忘了删除前面那句“好的,下面是为您润色过的邮件”,直接给发出去了,尴尬得我又特意写了封邮件解释。

  现在在豆包电脑版里打开网页,再也不需要切换来切换去,邮件回复栏已经出现了“帮我写”选项。

  我让它帮我写一封邮件,回复麦当劳发来的活动广告,然后说我很愿意参加活动而且想要领取十个免费麦乐鸡。

  而且豆包还可以对邮件的语气、长度以及语言进行调整。大家觉得我能获得十个麦乐鸡吗?|作者

  回邮件只是写作场景之一,生活中需要写的东西可不止这些。豆包电脑版提供了小红书文案、朋友圈、日周月报、PPT大纲、营销文案等各种模板,填写关键词就可以一键生成。

  豆包更好用的一个场景,是读大文本和长论文。豆包电脑版一次能上传50个文件,支持多种格式。

  以前读一篇长论文,要把论文拆成很多个部分,分别导入ChatGPT再贴到一块儿看,现在只需要用豆包电脑版打开文档,点击“AI总结”,就可以生成文字版总结或者思维导读大纲。

  不需要进行多次翻译或者二次搜索,选中段落就能自动翻译、解释,点一点就能整理信息、分析信息、拓展信息。

  如果觉得这种“饭直接喂嘴里”的方式过于“粗暴”,还可以选择“AI伴读”功能,界面简洁清晰,看不懂的地方直接翻译,而且还可以追问拓展。

  总结提能不仅对文字适用,在视频和播客上也好用。不用像以前一样苦哈哈地视频转音频、音频转文字,用豆包直接打开视频链接或者小宇宙播客,可以直接提炼内容,甚至导出思维导图。这个功能非常适合在学习或者快速在一大段视频音频中找到自己需要的内容或片段。而且直接点击文字,视频就会跳转到对应的位置。

  1分钟看完何同学,劲省27分钟,什么小帅小美的都“退环境”了,以后看电影也拿这个来(不是)|作者

  在测试中,我发现了豆包对学术人最友好的一个功能——学术搜索。在之前,用GoogleScholar找论文简直像淘金,在处理一些不需要那么深入、或自己不太了解的新领域问题时会耗费大量时间,而豆包学术搜索可以基于论文库给出答案,还会标注好论文出处方便跳转到论文页面继续阅读,体验下来真是太丝滑了。

  而在数据分析这个专项里,不得不说豆包比我专业的多!处理大量数字非常消耗精力,现在在豆包里上传表格或者携带大量数据的文件,都可以快速生成数据分析报告。比如你可以上传你全年的记账数据,看看哪个方向的消费最高,哪个月消费最高等等。

  从上述两个功能可以看出,豆包的基础能力一直在持续升级,而和电脑工作流无缝衔接后更是打通了用AI使用的智能性和便捷性。感谢豆包还我“妈生AI”,工作效率得到了极大的提升。

  豆包电脑版打通多个软件,体现了集合的“集”字,而豆包这次升级的多模态能力展现“合”字。

  我提前用上了豆包内测版本,体验了一个在国内AI产品中不太常见的功能——跟AI通话。一键召唤豆包页面后,可以点击耳机图标进入通话模式,豆包界面缩小成通话窗口,可以和它练口语、模拟面试,也可以问它各种问题,或者只是当桌面宠物陪伴也很不错。

  我让她扮演面试官,我扮演申请英文媒体工作的记者,给我来一场模拟面试。豆包表现很不错,很好地缓解了我跟真人说话的紧张。

  既然都多模态了,画个画也是必须得有的。豆包的文生图能力也很强,而且还全免费。以后再也不用在图库里捞来捞去了,豆包可以根据要求快速生成视觉概念图或草图,海报、插图、视频素材可以随心生成,不再需要手绘。

  我让它帮我生成一张莫比斯风格的插图,它不仅完全还原了我的要求,还理解了我想要的风格。

  在生成图的过程中,字和人手这样的细节一直是个瓶颈,豆包也没能逃过,把我要求的“ZIMA BLUE”画成了“zzum bluee”,但是豆包文生图还有区域重绘功能,可以把画错的地方擦掉进行微调,如图调整后的版本已经让人非常满意了。

  另外,豆包我个人最喜欢的功能是写歌,不需要音乐基础,也能生成自己的专属音乐。

  我让它帮我写一首表现北京秋天的歌,民谣风格,使用男声音色,且要舒缓带着秋天的情绪。

  如果说“妈生AI”功能只是让我工作学习更便捷,那多模态功能可以说是让我在“全能”的路上越走越远,有了豆包,电脑从来没有这么好玩过。

  严格意义上的AIPC还要求把运算转移到本地,有更高的硬件标准,但在微软和苹果画的“大饼”还没落地前,谁也不知道所谓的AIPC到底是炒个概念还是真的实用。

  OpenAI创始人Sam Altman最近写了一篇文章,在里面预言了人和AI共存的未来:未来,我们每个人都会有一个AI团队,里面是不同领域的AI专家,能创造我们能想象到的任何东西——孩子们会有AI导师,我们会有AI医生,AI工程师……科技将我们从石器时代带入农业时代,再带入工业时代,从今天开始,通往智能时代的道路将由算力、能源和人类意志铺就。