AI大模型应该是目前整个科技行业最火热的概念,作为国内知名的AI领域的龙头企业,科大讯飞自然不会落后。很早开始,他们就在从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究。并且在过去几年,讯飞已经将很多产品和技术推向了包含电子消费、教育、医疗、办公、车载、智慧城市在内的多个行业和市场。
上周六,科大讯飞正式对外发布了新一代认知智能大模型——星火。这名字取自“星星之火,可以燎原”之意,体现了科大讯飞对于对于AGI的远景目标。除此之外,早在2001年科大讯飞“半场会议”上,创业团队就提出了“燃烧最亮的火把,要么率先燎原,要么最先熄灭”。同时 “星火”一词还来自中国传统文化二十八星宿中的“心宿”星座,被视为吉祥的象征,代表着力量、勇气和坚韧不拔的精神。所以从星火这个名字,也能看到讯飞的野心。
发布会后,我们第一时间深度体验了这款大模型,在这里我们分享一些我们对这款AI大模型的感受和体验。
中文自然语义理解能力更强
讯飞星火认知大模型在交互和界面设计上与大家熟悉的ChatGPT比较类似。作为一款对话类的自然语言模型,它通过自然对话方式做到对用户需求的理解与任务的执行。

既然是对话模型,首先要考验的是模型对于自然语义的理解能力。这方面中文相当有发言权。因为中文之所以复杂,除了本身表意的属性之外,在日常交流过程中,同样的文字、语句所表达的含义可能会随着语境、音调、习惯甚至是标点符号的变化而截然不同、传统的交互模型在面对中文这类复杂的自然语言的时候经常翻车,就是因为无法准确理解这些变化背后的含义。
举个例子:我单身的原因有两个:一是谁都看不上,二是谁都看不上。两个原因在语句上完全一样,但含义却截然不同。将中文作为母语的我们能够通过对整个语境的理解,很快明白二者之间的不同。
但AI会怎么理解呢?
我们将这句话输入ChatGPT,让它解释这两种说法有何不同。ChatGPT给出的解释是:

显然ChatGPT认为,这两种表述的意思都是一样的。只是“没有得到注意和认可”和“不被看重,缺乏吸引力”的区别。
再来看看讯飞星火给出的解释:

显然,讯飞星火模型给出的解释更为准确,它能够判断出这句话中“对别人的挑剔”,甚至还能够分析出一种说法是相对自嘲的,而第二种说法“显得自我膨胀”。这种判断是更符合我们对于这句话的双重理解的含义。
这里其实就体现了讯飞星火对于中文自然语义超高的理解能力,这主要是得益于其本身作为一款中国本土市场的AI模型,能够基于海量中文文本语料进行训练,同时在相关的核心算法上也更贴近与中文的使用环境和习惯,在对于中文自然语义的理解方面,讯飞星火认知大模型拥有先天的优势。



我们还输入了一些其他比较复杂,或者有多重含义的中文语句,讯飞星火都能够根据所在的语境的不同给出相对准确的判断,能够很自然的理解这些语句背后想要表达的真实意图。
生成文本能够“拿来即用”
相对于这些单一的自然语言的理解能力,文本生成能力应该是这类语言大模型在当下最具“生产力”的特性。讯飞星火同样支持强大的文本生成能力,它能够根据需求创作出邮件、讲稿、文案等等任何文本内容。
这种文本生产的过程非常简单,你只需要赋予身份、描述背景、提出需求,这三个步骤就能够让AI模型生成文本,最后你可以再根据生成的文本进行一些细节上的调整和条件的补充。经过我们的实测,讯飞星火大部分时候生成的文本,都能够做到“拿来即用”的水平。
还是举例来看,我们告诉讯飞星火:你现在是一位小学班主任,你的一名学生因为经常违反课堂纪律,现在需要给他的家长写一封书信,告诉他们孩子的基本情况并且希望他们能够协助你和学校妥善的解决这个问题。
以下是讯飞星火提供给我们的内容:

可以看到,讯飞星火能够根据你简单的描述,直接生成信件的基本内容。并且这封信件的内容本身在逻辑性、通顺性、可读性方面都没有什么问题。你可能注意到,这封信件的措辞和一些描述可能相对比较生硬和直接,需要修改地委婉一些。于是我们向讯飞星火提出需求:希望措辞能够委婉一些,并且淡化孩子违反纪律的描述,更注重强调孩子的教育和关切问题。

在我们提出了更细化的要求之后。讯飞星火能够准确理解“委婉”的含义,最终生成的文本内容在整体的措辞和语气方面都显得要温和许多。它甚至还能够自己拿出一些可行性的建议和意见,来解决存在的问题。让整个信件内容传达出了对孩子问题的关注,以及希望寻求家长的协助,共同来帮助他解决问题的态度。
现实中如果你真的想要借助星火来生成一些文本内容。你可以向它提出一些更为具体和细致的要求,进而获得更理想的最终文本。实际上,仅从文本内容的创作能力来看,讯飞星火这类AI的水平已经超过了大多数的普通人。