在智能时代的背景下,人脸识别、智能驾驶、智能语音识别等应用如雨后春笋般涌现。其中,智能驾驶领域,智能人车交互成为开发者与用户共同关注的热点,而车载语音已经成为智能驾驶产品的必备功能。为了让用户在车载场景下拥有更好的听觉体验,我们收集了用户对语音形象的偏好,并尝试探索适合车载产品的语音形象。
1
说起“语音形象”,你想到什么?
看到“语音形象”这个词,你会不会挠挠头,不知道它到底想表达什么?那让我们先来看看,当我们在说“语音形象”的时候,我们到底在说什么。
首先,为了定义“语音形象”,我们挑选了20名用户进行访谈,让受访者对同一段语音进行自由描述,得到的答案有“女性、25岁左右、大堂迎宾”,“阳光、青春”、“不够亲和,有点呆板”等等。总结发现这些描述内容主要集中于基础属性、性格气质、声音特质这三个维度。
其中,通过对用户访谈内容的进一步归纳,我们将基础属性这一维度细分成性别、年龄、关系、职业四个关键元素。
我们同时参考了心理学体液气质理论*,将语音形象的性格气质维度分成胆汁质(主动、直率)、多血质(活泼、开朗)、粘液质(稳重、冷静)、抑郁质(腼腆、细腻)四个元素。
最后,我们结合相关文献*,将声音特质划分为音色(高亢、空灵、低沉等),语气(高冷、随和、热情等),节奏(起伏、快慢、强弱)三个关键元素。
注1*:最初,学者希波克拉底认为血液、粘液、胆汁、黑胆汁四种体液形成了人体的性质,机体的状况取决于四种液体的正确配合。后来,盖伦用气质代替了希波克拉底体液理论中的人格,将人划分成四种类型:多血质(体液中血液占优势),粘液质(粘液占优势),胆汁质(黄胆汁占优势),抑郁质(黑胆汁占优势)。此分类方式一直在心理学中沿用至今。
注2*:宋雯、李炽叡的相关研究与《何把握说话的节奏》等资料。
综上所述,车载场景语音形象构成模型就诞生了——
在接下来的调研中,我们以上图中的模型为基础制作问卷,来探究用户对语音形象的偏好。
2
用户想要听到怎样的声音?
在清楚“语音形象”是什么后,让我们来看看用户对声音形象具体会有怎样的偏好。
我们将问卷投放到百度地图活动专区,一共回收到4372份样本,其中有效的有3745份。在对有效样本进行整理、数据分析后,我们初步总结了出用户偏爱的声音特征。 在基础属性维度,可以发现大多数用户相对更偏好18-32岁,职业为播音或者主持(也有25.6%的用户希望声音形象的职业为秘书)的女性声音形象,并且希望该语音产品能成为自己的得力助手。
对于性格气质,用户偏好活泼、开朗的多血质形象,这种形象给人阳光、亲和、易交往的感觉,使用户更愿意与语音产品对话;而偏内倾的稳重、细腻的形象也同样被部分用户接受,因为这种形象给人可靠和专业的感觉。
声音特质方面,由下图可直观得出,用户更偏好甜美的音色与亲切、随和的语气(清脆、温和的音色和热情的语气也同样被部分用户接受);通过数据分析同样可得知,用户较喜爱舒缓型节奏(有适当起伏、从容不迫、不急不拖沓)。
除了对整体用户偏好的探讨,我们也从更多角度处理数据,研究了不同性别、年龄的用户对语音形象是否有不同的偏好。 我们发现,女性用户更愿意接受男性、年龄稍大的专家形象,偏爱稳重的气质与温和的音色,可以推测女性用户认为成熟可靠的形象可以给她们带来信任感和安全感。
而男性用户对性格气质的偏好与整体用户一致,相对更青睐于活泼的年轻女孩形象(下图挑选了统计学上有显著差异的指标进行展示)。
年龄层面,不同年龄用户偏好基本没有差异,与整体用户偏好一致。但相对来看,更大比例的大龄用户偏好主播/主持形象,且随着年龄增大,用户越发倾向于接受稳重的语音形象。
3
一起揭秘最match的语音形象吧!
虽然分别了解了用户喜欢的各个元素,但在脑海里想象出一个完整的语音形象还是很难吧?别着急,揭秘环节来了!
我们将每个维度中用户选择排名前三且占比超过20%的元素(如“助手”在关系偏好占比为65.1%,排名第一)统计成下面的表格,并将表格中各个维度里的元素进行组合,生成了四个具体的语音形象。他们分别是甜美女生、温和御姐、活泼女孩与爽朗男性。
在这里,我们以最受欢迎的甜美女生为例,展示甜美女生的具体形象是如何筛选、塑造的。
通过将上表中各维度用户最喜爱的元素进行组合,形成车载场景下最理想的语音形象——甜美女生。
同时,我们将各维度用户第二、第三喜爱的元素进行合理组合,形成车载场景下用户能够接受的候选形象。 考虑到车载语音系统设计的完整性,我们尝试向用户提供个性化的男声形象,希望能满足少数用户的需求(通过进一步的数据分析,我们发现男性形象应该符合成熟、可靠的特点,具体表现为年龄稍大、性格稳重、声音浑厚爽朗等,能给人专业感、安全感)。 详细语音形象如下表所示:
基于以上的总结与发现,我们提供了车载场景下语音形象设计的基础框架,接下来让我们来看看,语音形象设计时,要塑造怎样的形象,避免什么雷区呢?
以上就是本次调研的过程与结论了。在下一期文章中,我们将会把文字化的语音形象与具象化的声音相连接,从而更具体、精准的定位出用户最喜爱的语音形象,敬请期待!