作者|三北
编辑|沙漠阴影深圳网友称盐田名字不好提议改名
智东西12月27日报道今年9月,国外一名身患怪病的男孩求医3年17个医生,却因为被ChatGPT确诊为脊髓栓系综合征而成功抢救。这让人们第一次直观地感受到大模式在健康信息服务领域的巨大潜力。
现在,这种潜力正在被科技公司转化为端到端的闭环产品。一些科技公司为医疗机构客户开辟了大型模型服务,一些团队开辟了大型医疗模型群。不过,据说智能搜索引擎夸克App最近悄悄推出了一款“夸克健康助手”。
日前,夸克对健康搜索进行了全面升级,用户将在部分搜索结果中获得夸克健康助手提供的AIGC内容。据悉,夸克搜索健康信息的正确率超过90%,居行业第一。
▲在夸克App中调用夸克AI健康助手。
初次体验后,用户可以在App首页添加夸克健康助手,方便调用。
▲在夸克App首页添加夸克AI健康助手。
据夸克负责人介绍,夸克自主研发的模型以486分的高分通过了临床执业医师资格考试,健康内容的错觉率降到了5%以下,达到了远超同行的水平。
自年初ChatGPT爆发以来,微软、谷歌等科技巨头纷纷推AI搜索引擎。而在对专业知识要求较高的健康信息服务领域,各路玩家可能会保持观望或小范围试水。作为2018年定义智能搜索引擎定位的新锐玩家,夸克率先迈出了健康领域创新搜索的第一步。
夸克自研大模型在搜索中的实际落地效果如何?背后有哪些技术挑战和行业真相?本文通过深夸克健康模型的应用,对此进行了深入的探讨。
一、实测AI健康助手:简单对话,多维度诊断
打开夸克App,虽然首页没有明显变化,但是搜索结果已经被夸克大模型悄然改变。
如下图所示,当知止输入“咳嗽检查”的问题时,搜索结果中出现了AIGC的内容和夸克健康助手的入口。用户可以先简单了解症状的信息,再根据自己的身体情况进行选择和对话。
点击进入夸克健康助手,页面变成对话框。当知止换了一个问题:“口腔溃疡频发的原因是什么?”,夸克健康助手从非病理因素和病理因素给出了答案。或许是因为回答比较模糊,夸克健康助手进一步给了我一个卡片选项,让我补充症状,得到更准确的答案。
在我提供了补充症状后,夸克健康助手真的给出了更有针对性的治疗建议,并对主要原因分析、科室医疗建议、如何进一步诊断等一系列问题进行了解答。手机网络电视遥控器
当知止问道,“家里的老人刚刚做完颈椎手术。有什么吃的建议?”当时夸克健康助手给出了针对性的饮食建议。说到侧门,比如“有人说鱼是毛,能吃吗?”夸克健康助手也可以根据跨中西医的知识给出明确的分析判断:“可以适量食用”。
夸克健康助手的一个特点是案例描述具体,而非笼统,因此具有较强的参考性。
例如,当知止问:“我的肘部有一个小红点胎记,不光滑,有些充血。可能是什么病?”夸克健康助手马上给出了几种可能,血管瘤、鲜红斑痣、草莓状毛细血管瘤。
通过“柔软可压缩”、“菜花样”的描述,以及超链接中的图片,血管瘤的可能性似乎更大。通过夸克健康助手,我进一步了解到这是一个良性肿瘤,大概率不会给身体带来危险。其实这是我家的真实案例,夸克给出的判断和之前医院检查得出的结果是一致的。
再来看看智能筛选功能。比如,智能的东西在搜索引擎中输入“一个55岁的男人手臂麻木是怎么回事”,智能筛查卡就会弹出来,给出持续时间、发病部位、行为激励等多项选项。
在我选择持续数月的单边选项时,夸克提出可能与颈椎病、脑出血、脑血管疾病有关。点开可能出现的症状,比如点开脑出血板块进入回答链接,只看到首都医科大学主任医师回答我背后的原因。
事实上,这个案例中的患者确实是在出现手部麻木症状几个月后突发脑溢血,说明这个智能筛查的功能还是比较有参考价值的。
试用知止后发现,夸克健康助手基本没有答非所问、胡编乱造、上下文不通顺的情况,甚至给出了比较准确的初步诊断结果。这种建议虽然不能代替医学诊断,但有助于帮助患者在就医前进行初步的自我检查。
必须承认,夸克健康助手在回答一些问题时比较保守,比如在多次建议后指出“以上建议仅供参考”,但作为辅助健康助手,已经比传统搜索引擎好很多了。
第二,安全性和准确性是大型模型进入专业领域的第一关。
体验了产品应用之后,我们把目光转向了行业和技术。
从一般搜索到健康等专业搜索领域,大模式正在彻底改变搜索引擎的玩法,背后的关键因素是知识准确率的提升。
回顾年初ChatGPT在全球范围内的爆发,先是微软率先将ChatGPT接入Bing搜索,接着中国的Google、百度、Quark相继将搜索引擎接入大模型,短视频平台Tik Tok近日传出正在测试AI视频搜索…互联网巨头纷纷抢滩AI搜索赛道。
其背后,大模式正在打破传统搜索引擎的技术瓶颈:传统搜索引擎依赖关键词匹配,难以理解上下文;只检索互联网上已有的内容,内容相关性和质量不足;信息真假难辨,误导用户。大模式对搜索的改革已经达成共识。基于理解、知识、创造、对话、推理等多重能力,带来更加精准、全面、互动的信息服务体验。
但与此同时,大模型在知识准确率上表现不足,阻碍了其进入更专业的信息服务领域。
以健康领域为例。这是一个很多人使用搜索引擎的典型场景,但却是大模式久攻不下的理想城市。定时器程序代码
背后的原因还是“错觉”的问题。由于医生无法向患者详细讲解每一项医疗健康知识,患者的知识需求很多都是通过网络获得的。但由于大模型的错觉,会捏造信息,很可能会给出错误的疾病判断和用药建议,使患者延误病情,后果不堪设想。
安全和准确是健康信息服务的第一道关口,夸克专门针对这个问题进行了攻关。夸克负责人表示,夸克在健康行业做了大量的数据建设和知识建设,使其知识错误率可以降到5%以下,有信心将产品推向广阔的C端市场。
解决大规模模型应用问题,首先要解决知识正确性问题。为此夸克构建了大量的医学百科和医学问答的C端用户数据,梳理了大量的指南、标准、书籍等数据,构建了完整的医学知识图谱,从而大大减少了大模型的假象。
值得一提的是,为了保证内容的专业性、正确性和科学性,夸克还成立了健康专家组。一方面,与200余位权威医学专家、60余家知名公立三甲医院、40余家医疗机构合作,构建大模式内容生态;另一方面,夸克招募了健康模型的精调师,结合用户需求和流行疾病,提供最新的健康知识。
由此产生的夸克自研模型千亿级参数,帮助其跨过安全和准确的第一道关口,进入专业搜索领域。
三、千亿级参数模型,改变搜索的四大招
知名研究机构IDC今年8月发布的报告显示,在大模型的推动下,2027年全球人工智能IT投资总额有望增至4236亿美元,约合人民币3.1万亿元。在这一新蓝海前景下,互联网巨头、科技行业领袖、AI创业者展开了声势浩大的“百款大战”。
随着“百模之战”的焦点演变为大模型的产业化,像夸克这样跨域的玩家迅速走到了聚光灯下。
夸克于11月22日正式公布了拥有数千亿参数的全栈自研夸克模型。同时,夸克大模型在C-Eval和CMMLU两个权威榜单上都登顶,性能在很多方面都优于GPT-4,在法律、医疗、问答等领域的性能评测中也获得了冠军。
取得这些成就并非没有挑战。
据夸克负责人介绍,针对上面提到的错觉问题,夸克在数千亿的网页中选择了数亿的优质网页。这个筛选过程极其复杂,获取海量中文数据和知识非常困难。网页中有大量的垃圾数据,对于非搜索引擎厂商来说会非常昂贵,但Quark成功高效地解决了这些问题。
与此同时,国内外大模型玩家面临的另一大挑战是人类知识和SFT(监督微调)精确数据的比对。由于有用的SFT样本数据稀缺,夸克专门建立了一个专业团队,包括医生等行业的资深从业者,通过跨领域运作来克服困难。
最后,基于搜索业务的基础和智能技术的积累,夸克大模型试图从以下四个方面构筑护城河:
1、最全面的通用知识数据和行业知识数据,以及知识理解和评价体系;
2.基于搜索技术体系的积累,打造了千亿级参数平台的模型训练能力;
3.拥有长期智能产品经验的智能科技生产运输团队,覆盖搜索、智能、工业等多维领域。
4.拥有全行业的知识来提升技术体系和能力,帮助大模型减少幻觉,提升可用性。
当前大模型的爆发可以追溯到2017年Google提出的Transformer模型。一年前刚刚诞生的夸克也关注到了AI的发展趋势,并在2018年立即提出了基于AI的智能搜索引擎,确立了“基于AI技术,做前沿,无畏创新探索”的研发方向。
如今,随着围绕《变形金刚》的大型模型技术体系的发展,夸克在智能信息服务领域亮出了四把剑,向传统搜索行业吹响了变革的号角。
结论:大模式带来信息搜索新玩法。
大模式将带来全新的搜索引擎玩法。正如清华大学新闻学院教授、博士生导师沈阳所言,搜索引擎天然拥有各种网络公开数据,在内容安全方面久经考验,用户提供大量的交互查询需求,所以搜索引擎和大模型的结合是天然的匹配。
相比微软、谷歌等传统搜索引擎巨头,智能搜索引擎新玩家夸克选择从健康这个高度专业化的场景来突破AIGC应用。直击行业痛点的背后是其在数据、搜索技术、知识增强技术、团队等方面的差异化打法。然而,AI搜索之战仍处于早期阶段。谁会在产品竞争中赢得更多用户的心,还得等待时间来验证最后的答案。
未经允许不得转载:科技让生活更美好 » 人手一个AI健康助手!大模型时代的搜索引擎「蜕变」