V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
param
V2EX  ›  奇思妙想

完全不同意 Google 搜索会被 Gen AI 颠覆,相反,我觉得 Google 会受益于 LLM 技术。

  •  
  •   param · 29 天前 · 1048 次点击

    我目前仍然离不开 Google 搜索,我觉得 Gen AI 给到的内容是主观的,而 Google 搜索出来的结果是客观公正的。 AI Agent 确实可以调用搜索引擎来进行网页搜索,目前 Google 也可以整合各个搜索结果进行信息汇总,但这两种方式都有一个共通问题,就是我并不信任 AI 汇总出来的结果,它会把什么阿猫阿狗的观点都引用进来。要知道,我们平时使用搜索引擎的方式,并不是搜到什么我就信什么,同一个事情,不同人会有不同说法,如果 AI 通过搜索向我推荐一个产品或报道一则新闻,我也还要 Google 搜索一遍,看看不同人的评价和看法,不然谁知道那会不会是某种商业广告或政治宣传呢。我们平时使用 Google 搜索,并非单纯是对搜索结果进行信息汇总,中间还要加入自己的主观判断,去进行信息源的挑选。一般来说,官方发布的会比民间的可靠,维基百科会比内容农场可靠,搜索排名靠前的会比靠后的可靠,权威人士会比百度知道上某个不知名网友要可靠。

    LLM 的出现,确实解决了传统 Google 搜索当中搜索结果与用户意图不匹配、需要从网页中提取要点等难题。我想要的产品形态,应该是兼具两者的优点,既保持搜索结果的高度匹配,又能从网页中摘要出重点,同时还不失客观性,直接告诉我不同人怎么看待同一个问题。例如我输入「月经能吃冰吗」,它能列举出来告诉我,人民日报认为怎么样、丁香医生认为怎么样、某某博主认为怎么样。那么,Google 只需要再做两项改进,就能满足到我对于资讯获取的需要:

    1. 基于 LLM 筛选搜索结果:通过 LLM 可以精确识别用户意图,对搜索结果进行更符合意图的排序,用户最关心的内容排到前面,与用户意图不相关的直接过滤掉。
    2. 对每个搜索结果单独汇总:在每项搜索结果的旁边,根据用户意图汇总出用户关心的答案,这样用户多数时候并不需要点进网页即可快速获得所需,同时又能对每个网页给出的不同答案和观点一目了然。如果需要了解详情,也仍然可以进入网页查看全文。

    由于人与人之间的价值观存在差异,每个人信任的信息源都各有不同,因此也很难让 AI 代替个人来完成信息源挑选的工作。比如「月经能否吃冰」的问题,不信中医的人可以直接排除中医的答案,即使要用 AI 汇总,也应该在人工挑选之后再进行汇总。

    很多人认为 AI 会颠覆 Google 的搜索业务,让 Google 传统的网页广告商业模式难以为继,甚至成为下一个 Yahoo 。但我认为,只要搜索与 LLM 结合得好,那么凭借 Android 和 Chrome 上巨大的用户基础,以及搜索引擎中庞大的数据优势,Google 作为互联网信息入口的地位仍然一时难以撼动。不仅不担心广告业务受到冲击,反而由于 LLM 对于用户意图准确的理解能力,使得广告也更懂用户,更加精准匹配,也更有效了。同意我的话可以去抄底 Google 。

    8 条回复
    MajestySolor
        1
    MajestySolor  
       29 天前
    现在只有那些涉及到当前时效性的东西才用传统搜索,大部分情况下都用 ai 解决了🤣
    WuDiHaiTai
        2
    WuDiHaiTai  
       28 天前
    你是否在找"百度 AI"

    最近微博弄了个微博智搜,放在搜索功能里,个人非常反感这种搜索,结果太智能,智能到可以控制你能搜到什么。至于百度和豆包,我认为他们的智搜并不准确,专业问题,非常大概率会给出错误答案,浪费我眼睛 1 秒都是浪费。

    正确的做法我认为是能控制 AI 开关或单独搜索,我想问 AI 时候我会自己去问,不要把垃圾塞到我嘴里。
    param
        3
    param  
    OP
       28 天前 via Android
    @WuDiHaiTai 我觉得不是需要关,我已经说了,搜索结果并不需要 ai 进行汇总,而是只需要 ai 划重点
    WuDiHaiTai
        4
    WuDiHaiTai  
       28 天前
    @param 例如百度 AI 在分辨结果是真是假上能力欠缺太大,在错误答案上划出的重点还有什么意义。仅依靠搜索引擎搜索的好处是你可以很直观的判断你要看谁的,谁的不可信,而 AI 的结果经过这些垃圾答案的污染,次数多了,即便他的回答正确,我也不会看他。换句话说,它可以帮助你 100 次,但坑你 1 次就够难受的了。

    并且对于一部分人而言,比如我,我大多数时候搜索的结果是一段话说不明白的事,假设我要搜索一个 Java 报错,我想知道前因后果,那么百度 AI 它一定会告诉你这个报错是什么,可是这个报错怎么来的,什么引起的不说,你也没法继续让它回答,除了浪费屏幕空间、你的时间,没有任何好处。而这个问题,正常的搜索,哪怕点进 CSDN 都能给你一次说个明明白白。


    想找个例子并不容易,因为先前挂壁时候做过几个月的 AI 数据标注,在法律方面 AI 是完全的法律白痴。
    例如下图,AI 最后的回答本应是治安管理处罚法第二十五条的范畴,但是 AI 扯到了刑法上,这对需要问这个问题的人来说就是纯垃圾信息,纯误导了。





    百度也挺有意思,AI 在关于法律第几条这种事情上表现特别差,这也是生成式 AI 公认的缺点之一,做不到非常精确,百度 AI 没有阐明这是第几条法律,只说出自哪里,不说就不会错。尤其与数字有关的事,AI 真的没用。
    WuDiHaiTai
        5
    WuDiHaiTai  
       28 天前
    @param
    纠正:"想找个例子并不容易,因为先前挂壁时候做过几个月的 AI 数据标注,在法律方面 AI 是完全的法律白痴。"

    这一段没说明白,那时候我的工作之一,就是对 AI 的问答纠正,拿着用户提问的法律问题去对 AI 答了什么 shit 并改正回头再拿去训练。AI 说话要引用法律的嘛,错误率大概 80%,比如本是第 123 条的事,它会说出自第 223 条,或者它说 223 条,但你去查 223 条法律发现,这条根本不是他要说的那条法律而是别的。

    还有公司的报表,给一篇 PDF 让它找里面哪一条数据,或者给他几行数据,例如英伟达的 5 年财务取平均值,它的出错率可以说是 100%。

    所以这次 DeepSeek ,政府公职人员发了疯一样的追捧,让我感到一种惶恐,很多人觉得 AI 的结果是很可信的,这很恐怖,dude.
    param
        6
    param  
    OP
       28 天前 via Android
    @WuDiHaiTai 所以我就说,这种 ai 汇总答案的用法是垃圾,我根本不会相信 ai 汇总出来的内容,我仍然需要传统的搜索结果,只不过需要 ai 在这些结果之上进行筛选、排序,并划出每个网页描述的重点。实际上这本身就是传统搜索引擎的一部分,传统搜索引擎也有传统的网页排序机制,也有传统的网页内容预览,只不过是传统的算法不够智能。
    传统搜索引擎的好处就是我可以识别每个网页是否可靠,我知道哪些网站说的内容不可信,哪些更可信。如果 AI 把搜索结果进行一个汇总,就相当于把所以搜索结果都当成正确答案,所以是垃圾。
    我不需要 AI 汇总,我只需要 AI 划出重点,到底说得对不对,留给我自己判断。
    param
        7
    param  
    OP
       28 天前 via Android
    @WuDiHaiTai 搜索引擎本身不会给我答案,就算给了我也不会信任,它只是整合各个渠道的消息,充当各个渠道的媒介,让我知道不同的网站、不同的文章对同一个事情有什么不同看法。只是 AI 可以让我在预览界面就能知道每个文章在说什么,不一定需要点进去。
    WuDiHaiTai
        8
    WuDiHaiTai  
       28 天前
    @param #7 大概明白了你的意思,如果是在每个网页中读取最重要的信息,那么我觉得是没什么问题的,可以作为该网页的第一步入眼的参考。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2803 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 06:03 · PVG 14:03 · LAX 23:03 · JFK 02:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.