Lumina – 完全免费的AI学术搜索引擎

一、Lumina网站简介

Lumina是一个较新的搜索引擎网站,它的开发团队仅由三人组成,且已获得YC投资 。

Lumina搜索引擎主打学术搜索领域,声称能够比谷歌学术搜索的相关性高出数倍。开发团队为了证实其性能,进行了基准测试,并且将代码库开源,此测试中使用到GPT – 4担任评判员,对Lumina的基础搜索模式(LuminaBase)、递归搜索模式(LuminaRecursive)与SemanticScholar以及谷歌学术搜索结果在相关性以及精确度等方面加以比较。

例如,在基础搜索模式下(LuminaBase),Lumina搜索结果的相关性比谷歌学术高4.8倍,比SemanticScholar高8倍;在递归搜索模式下,相比谷歌学术高6.8倍,比SemanticScholar高11.3倍,评估均基于生成的约2470个查询数据集。此外,Lumina在每次检索中能稳定提供2 – 3个高度相关结果,而谷歌学术只有50%的检索能提供1个高度相关结果,SemanticScholar仅有30%的检索能达到此标准。而且团队透露,使用LuminaAPI和一个简单的递归脚本,可以使相关性比谷歌学术高11倍,LuminaAPI也即将发布。611e6aa5e7404c1053b3143c9bde1c13

二、Lumina搜索引擎的主要内容

Lumina作为一个搜索引擎,最主要的内容就是为用户所输入的查询提供相关的结果。由于定位为学术搜索引擎,它主要索引的是学术资料,可能涵盖多个学科领域诸如科学、技术、人文社科等领域的学术论文、研究报告、学位论文等学术资源的相关信息。在搜索结果呈现当中,除了显示传统搜索引擎提供的网页标题、链接以及摘要之外,可能基于它偏学术性的定位,还会显示与学术资源来源紧密相关的信息,比如来源的学术数据库、发表的期刊等情况,方便用户判断搜索结果与自身需求的匹配程度以及学术研究背后的来源的权威性等内容。

此外,它不单单进行基础的搜索结果的输出,Lumina搜索引擎为搜索结果还提供了AI概述功能。举例来说,如果用机器学习关键词搜索,它就会引用检索出来的论文总结介绍机器学习。同时如果点击AI概述中有下划线的关键词,就会触发对该关键词的进一步检索,这样可以让用户通过一次查询不断深入挖掘与查询主题相关的内容。并且在AI概述下方,还有对搜索论文研究成果图表的汇总,有助于用户快速地从视觉上对一些数据或趋势进行把握信息的整合概括提炼 。

三、Lumina搜索引擎的功能介绍

搜索相关性高效能

  1. 多样搜索模式下的高性能
    • Lumina有不同的搜索模式,在基础搜索模式(LuminaBase)就已经表现卓越,其搜索结果相关性对比谷歌学术和SemanticScholar处于优势地位。例如在基础搜索模式下,与谷歌学术和SemanticScholar相比所呈现出的倍数关系差异,反映出这种搜索模式在处理搜索需求时,从索引内容和算法逻辑上能够更精准地定位到和用户需求相关度高的学术资源。在递归搜索模式(LuminaRecursive)下还能够进一步提升搜索结果的相关性,这说明其搜索技术可以在基础匹配之上,以现有的结果为基础进一步层层深入挖掘更多相关联系的资源,像在研究项目深入进行过程中,随着对前期查询结果的分析,往往需要不断拓展更多相关资料来确定方向,此时递归搜索模式就有很大的价值 。
    • 并且Lumina每次检索都能稳定提供2 – 3个高度相关的结果,这种稳定性对于学术研究或者其他对搜索结果准确性和密集型查询需求的用户来说非常关键。
  2. 多种查询途径的相关性提升
    • 使用LuminaAPI配合简单的递归脚本,可以使搜索结果的相关性比谷歌学术最高提高11倍。这体现了其对外提供的接口有很强的灵活性和扩展性,开发人员可以基于此开发更多样化和个性化的搜索服务或者对搜索结果进行二次挖掘分析。这一特性对于需要构建个性化学术搜索系统,或者进行大规模学术数据整合分析的机构和组织非常有吸引力。

AI概述功能突破传统搜索

  1. 智能总结与关联
    • Lumina的AI概述功能为用户提供了关于搜索结果的高度智能整合。以机器学习关键词搜索为例,当搜索到相关的论文资源后,Lumina会直接引用这些论文总结介绍机器学习相关内容。这打破了传统搜索只提供一堆链接,需要用户逐一阅读才能够获取有效信息的局面,节省了用户大量时间。
  2. 关键词动态拓展
    • 在AI概述当中,如果存在下划线的关键词,当用户点击后就会触发对该关键词的进一步检索。这样的功能能够让用户基于一个宽泛的搜索主题,比如“人工智能在医疗方面的应用”,从最初的整体搜索结果中某个资源提到的具体医疗场景或者人工智能算法这个关键词进一步挖掘专项信息,实现从整体到局部再到具体细节的全方位搜索体验。用户可以根据不同的下划线关键词,连续深入查询,形成一个知识挖掘的链条,将探索深度在一个页面操作上不断加深。

四、Lumina在用户中的评价情况

来自开发团队和业内人士的积极评价

  1. 开发团队自信宣称优势
    • 这个由三人组成的开发团队宣称他们花费数月打造的Lumina搜索引擎优于谷歌学术搜索,这种声明体现了开发团队对其所研发的搜索引擎的充分自信。团队通过自己开展的基准测试对比结果,例如在相关性倍数上远超谷歌学术和SemanticScholar的成绩来证明自身实力,并且敢于拿自己的产品和搜索引擎巨头谷歌的学术搜索产品比较,侧面反映出开发团队对Lumina搜索结果准确性方面抱有坚定的信心 。
  2. 业内人士鼓励尝试
    • 例如AI3D模拟引擎Ego联合创始人兼CTO、前Meta研究员看过后表示“闭眼冲”,这种来自行业内有一定专业背景和影响力人物给予的积极反馈,一定程度上是对Lumina搜索能力的认可。而且通过开源基准测试等手段,从开发的开放性和被外界审视的能力等方面来看,也增加了业内人士和潜在用户对这个搜索引擎的信任度。

基于性能数据的吸引力分析

  1. 高相关性结果数据的说服力
    • 从基础搜索模式到递归搜索模式下与其他学术搜索引擎相比的相关性倍数提升,以及每次检索稳定输出的高度相关结果数量,比如Lumina在每次检索能给出2 – 3个高度相关结果,而谷歌学术只有50%检索能给出1个高度相关结果等对比数据,这些数据从实际使用效果和预期满足程度上给潜在用户很大的吸引力 。
    • 对于学术研究人员和学生而言,用更少的查询时间获取更多高度相关的学术资料是非常重要的,Lumina在这方面的数据表现说明了它可能改变或优化用户的搜索习惯,为用户在海量的学术资料中找准方向。
  2. 多语言支持增强用户覆盖范围
    • Lumina支持24种语言,这一特点极大地提升了其在全球不同语言群体中的适用性。很多传统搜索引擎在多语言搜索结果的准确性上可能有一定的局限性,而Lumina的这一功能可以吸引来自全球各个地区使用不同语言的科研人员、教师、学生等群体。