北京儿童插座价格联盟

为什么你会突然忘记一个朋友的名字?

只看楼主 收藏 回复
  • - -
楼主

各位手机屏幕前的观众朋友们大家晚上好

欢迎收看《容安馆札记》


大家先来设想这样一个场景

一个寒意在空气里浮动的冬天

你和好朋友正吃着火锅唱着歌

迎面走来毕业十年未见的老同学

你推座起身

心中的惊讶怀念和狂喜撞击翻腾爆发冲上脑门

你要喊他的名字

然而要死要活半死不活就是想不起来

智商和显示妥协之后终于从口中憋出


“诶!老同学!”


对方愣了一愣


“哎,马冬梅!是你呀~”


然后你开始和对方侃大山

发挥《谁是卧底》侦探学的才能

从对方的话语里推测对方的身份

终于在某一刻脑子一黑眼前一亮

想!起!来!了!


“夏洛呀夏洛!”

“干嘛”

“没事,好久没见感慨一下。。。”




这种别人的名字已经塞到嘴边、

呼之欲出,

又似是而非十拿九不稳的感觉

跟在厕所碰到情敌还要尴尬抓狂


在英文中,

这种现象被称作tip-of-the-tongue(唇边现象/欲言难吐)

然而这都不是重点



重点是我们为什么会出现这样的问题


首先

我们不愿意承认这是阿尔兹海默症的表现,

于是

就来想想其他原因



这个现象

其实跟我们人类的脑袋提取词汇的特点有很大联系


词汇提取lexical access

就是指词汇知识被激活的过程。

简单来说就是


您考四六级的时候碰到propaganda

然后在脑子翻箱倒柜找这个词和附属意义

虽然结果往往跟贾宝玉初识林黛玉的情况相似

只能喊一句

“这个妹妹我曾是认识的”

这就是词汇提取不出来





那什么是词汇知识word knowledge

今天馆长就来给你们科普一下好了

(心真是像夜晚的北京城一样累)


认识一个词就是要熟悉它的四个方面:


说、学、逗、唱


呸各位观众不好意思

刚刚馆长跑错剧组了

这一段我们重录哈


四个方面:


语音、句法、形态和语义


上面提到的tip-of-the-tongue

主要受词汇的语音知识影响


不信你听馆长给你忽悠



正是因为

马冬梅毕业十年都没张口喊过“夏洛”这个名字,

所以这个词的语音知识已经被淡忘于她的脑海

换句话说

马冬梅淡忘的不是夏洛这个人

而只是“夏洛”这三个字的发音


影响人类提取词汇知识快慢的因素有很多

其中主要的有


词频和语音特征和词法结构

和语法范畴和是否歧义

和是否遇到意义相同的词


等等

(一)词频效应:词频高的词更容易被提取

在人类漫长的历史长河里

“夏洛特”这个词出现的频率远高于“夏洛”,


制作方就利用这个语言学知识

把电影起名叫《夏洛特烦恼》

实现一种有趣的歧义



再举个例子

手机屏幕前的观众请想象自己在做专八

然后发现

自己的词汇量属于肯定得挂的那种小


于是就知道

要关注本馆多读书看报背单词

增加每个单词在你有限生命里

出现的频率

。。。




(二)上下文效应


遇到一个单词的时候

它的多个含义会在大脑里乱窜

但蹦跶不长久


因为根据上下文

人类能很快判断它到底是哪个意思,

当上下文语境和词的主要意义一致时,

很可能

只有那个主要意义被激活


在小说《白鹿原》里

“白灵同志!”

白灵为这个光荣陌生的称呼震颤

于是激情说道

“啊!你再叫我一生同——志!”


据馆长估计现在已经有人想歪了

所以想知道当时具体情景怎么样的

去看书


这也是我们记忆理解一段文字快慢的因素,

除了对单个词汇抓取的快慢,

背景知识的多少也尤为重要。


知道的越多

(死的越快)

上下文处理得越快

于是读和听的速度都会提高

这也解释了

口译员为什么事先刻苦准备背景资料



(这部偶像剧,看偶像就好了,别看剧)


(三)语义性效应(semantic priming)

意义相近的词有助于词的激活提取


在一个实验里面,

如果前面出现的都是

西瓜苹果、香蕉、葡萄这些表示水果的词汇,

那下面被试认出“番茄”这个词的速度就会

远快于

前面是护士、警察、工程师、教师表示职业的词汇



如果马冬梅还没想起夏洛的名字

于是就跟他侃大山聊以前的同学

那个王小明李大柱赵相机什么什么的

很可能就顺嘴把夏洛给带出来了


为了解释上面的现象

心理语言学学者先后提出了很多模型


其中

交股模型cohort model算是集大成者

这个模型主要用于解释我们如何辨认口语中的词汇

(英语听力不好的童鞋可以看过来~):


首先,基于我们对话语的语音-声学分析phonetic-acoustic anlysis),我们对所听到的词汇有个大致的语音印象,脑海中会有一系列词汇随之被激活,也就是词汇起始交股word-initial cohort,并不是一支股票……)。紧接着,我们会不断根据新的语义和句法信息来判断这些被激活的词汇当中,到底哪个是最终的胜出者。(然而我们身处非英语母语环境,不能熟练进行英语的语音-声学分析,而且也很难快速根据语义和句法信息来判断听到的到底是哪个词。所以为了增加我们这些分析活动的熟练程度、提高信息处理速度、提升我们的英文听力水平,我们最好从听写开始练习。


知道了人脑是如何提取词汇的

那么电脑又是怎么提取词汇呢


我们来举个例子


跟中国地球人生活更密切的问题

恐怕就是中文的分词问题。


换言之

计算机如何知道“夏洛特烦恼”

而不是“夏洛特/烦恼”


或者分辨

“结婚的和尚未结婚的”

而不是

“结婚/的/和尚/未/结婚/的”呢?


目前自然语言处理离不开统计模型,

所以中文分词问题的解决也要靠相关的统计模型。

什么意思?






我们假定一个句子S可以有三种分词方法,其结果分别表示为:


A1, A2, A3, …, Ak
B1, B2, B3, …, Bm
C1, C2, C3, …, Cp


其中,Ak、Bm、Cp都表示汉语中的词汇。最好的分词方法应该保证分词后这个句子出现的概率最大。换言之,如果说第一种分词方式(A1, A2, A3, …, Ak)是最好的,那么就应该有:


P (A1, A2, A3, …, Ak) > P (B1, B2, B3, …, Bm) 且P (A1, A2, A3, …, Ak) > P (C1, C2, C3, …, Cp)。


于是呢,你只要找出所有分词方式中概率最大的,就是最优的分词方式了


计算语言学其实跟语言学貌似没有特别强的联系?

对的!

鼻祖级别的贾里尼克(Fred Jelinek)就曾经说过:

“每开除一个语言学家,我们的语音识别系统正确率就会上升。

(Every time I fire a linguist, 

the performance of our speech recognition system goes up.)

当然,

这是大牛的玩笑话,

背后的八卦大家自行百度。



贾里尼克已乘黄鹤去



往期回顾:如何优雅地在中文系女生面前谈论线装书?

黑猫警长是只什么品种的猫?——大王派我来巡山

当我们消费道德之时,真理可能已经悄悄溜走

古书注解其实是诗人们发的微信朋友圈 (非中文系不会懂)

学英语,你可能需要这些资源

读完《黄金时代》之后

她们的世界:关于同性恋和同性婚姻你需要知道的一些事

如何修炼性感有腔调的英音


/

/



举报 | 1楼 回复

友情链接