科普丨什么是语言?什么是自然语言?-程序员宅基地

一、什么是语言?


语言(英文名:Language)是人类最重要的交际工具,是人们进行沟通交流的主要表达方式。人们借助语言保存和传递人类文明的成果。语言是民族的重要特征之一。一般来说,各个民族都有自己的语言。汉语法语俄语西班牙语阿拉伯语英语是世界上的主要语言,也是联合国的工作语言。汉语是世界上使用人口最多的语言,世界语英语是世界上使用最广泛的语言。据德国出版的《语言学语言交际工具问题手册》说,现在世界上查明的有5651种语言。在这些语言中,约有1400多种还没有被人们承认是独立的语言,或者是正在衰亡的语言。

语言是人们交流思想的媒介,它必然会对政治、经济和社会、科技乃至文化本身产生影响。语言这种文化现象是不断发展的,其现今的空间分布也是过去发展的结果。根据其语音语法词汇等方面特征的共同之处与起源关系,把世界上的语言分成语系。每个语系包括有数量不等的语种,这些语系语种地域上都有一定的分布区,很多文化特征都与此有密切的关系。语言是指生物同类之间由于沟通需要而制定的具有统一编码解码标准的声音(图像)讯号

语言又是符号系统,语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息,但这只是一些固定的程式,不能随机变化。


表达方式


语言就广义而言,是一套共同采用的沟通符号、表达方式与处理规则,符号会以视觉、声音或者触觉方式来传递。严格来说,语言是指人类沟通所使用的语言-自然语言。一般人都必须通过学习才能获得语言能力,语言的目的是交流观念、意见、思想等。语言学就是从人类研究语言分类与规则而发展出来的。研究语言的专家被称呼为语言学家。当人类发现了某些动物能够以某种方式沟通,就诞生了动物语言的概念。到了电脑的诞生,人类需要给予电脑指令。这种“单向沟通”就成了电脑语言


性质


编辑


语言是人与人之间的一种交流方式,人们彼此的交往离不开语言。尽管通过图片动作表情等可 以传递人们的思想,但是语言是其中最重要的,也是最方便的媒介。然而世 界各地的人们所用的语言各不相同,彼此间直接交谈是困难的,甚至是不可能的。即使是同一种语言,还有不同的方言,其差别程度也不相同。有的方言可以基本上相互理解,有的差别极大,好像是另一种语言,北京人听不懂广东话就是一个很好的例子。

不仅在不同的地区,有不同的语言和方言,就是在同一地区,不同的社会阶层,不同年龄的人之间都会有特殊的词汇来表达其独特的感情,使另一 阶层或不同年龄的人难以理解。如美国的黑人,他们虽然也使用英语,但是他们说的英语也有自己的特点,甚至被称为黑人英语。

在一种语言环境中掌握某种语言后,虽然也可以学会另一种或几种其他语言或方言,可是原语言或方言的口音很难完全改变,总会留下一定程度的原来所操语言的口音。熟悉语言的人往往就能从这些细微的差别中区分出说话人的家乡所在地及其身分和职业特征。

语言是文化的一个重要组成部分,甚至可以说没有语言也就不可能有文化,只有通过语言才能把文化一代代传下去。语言是保持生活方式的一个重要手段,几乎每个文化集团都有自己独特的语言。

语言是在特定的环境中,为了生活的需要而产生的,所以特定的环境必然会在语言上打上特定的烙印。另外,语言是人们交流思想的媒介,因此,它必然会对政治经济社会科技,乃至文化本身产生影响。语言这种文化现象是不断发展的,其现今的空间分布也是过去扩散、变化和发展的结果,所以,只有摆在时空的环境里才能全面地、深入地了解其与自然环境及人文环境的关系。


定义

语言的定义:以语音为物质外壳,由词汇和语法构成并能表达人类思想的符号系统。


特性

语言的特性有:创造性、结构性、意义性、指代性和社会性与个体性。


结构

语言的结构:音位语素、词、短语句子、全文。


种类

语言的种类:对话语言、独白语言、书面语言、内部语言

就大脑来说,语言分“脑语”和“嘴语”,脑语就是我们时时在大脑里产生称作“思考”或“思想”或“思维”的东西,脑语被嘴表达出来就叫“嘴语”。脑语和嘴语并不是一个东西,第一、脑语和嘴语在表达时失真;第二、嘴语不是脑语的唯一表达方式,因为脑语还可以通过肌肉群来表达:就是我们的行为。语言是一个人能力的重要表述部分。

语言分为“第一语言”和“第二语言”。

一个人从小通过和同一语言集团其它成员(如父母、亲属、周围的人们)的接触,自然学到并熟练运用于交际和思维过程中的语言。本族语言或母语一般说都是个人的第一语言,也是主要语言。

人出生后,首先掌握和使用的语言,叫第一语言。第二语言专指本国内非本族语。在全世界里,第二语言往往是和第一语言同时被使用的。


用途

语言的功能主要分为社会功能和思维功能两方面,其中社会功能包括信息传递功能和人际互动功能。

语言是思维工具和交际工具,它同思维有密切的联系,是思维的载体和物质外壳以及表现形式。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是人类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。语言具有稳固性和民族性

语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息但是这都只是一些固定的程式, 不能随机变化。只有人类才会把无意义的语音按照各种方式组合起来,成为有意义的语素,再把为数众多的语素按照各种方式组合成话语,用无穷变化的形式来表示变化无穷的意义。

人类创造了语言之后又创造了文字。文字是语言的视觉形式。文字突破了口语所受空间和时间的限制,能够发挥更大的作用。


文字

对于文字的发明,古人更加认为是一件了不起的大事。《淮南子》里说:“昔者仓颉作书而天雨粟,鬼夜哭。”最能表示文字的神力的是符号,这是跟口语里的咒语相当的东西。一般的文字也都沾上迷信的色彩,有字的纸不能乱扔,要放在有——“敬惜字纸”标签的容器里,积聚起来烧掉。文字里边当然也有避讳,嘴里不能说的名字,纸上也不能写;必得要写就得借用同音字,或者缺一笔。语言虽然可以作文字的基础,但语言毕竟不等于文字,尽管各国科学界和宗教界做出很大努力,然而世界上还有一半的语言没有相应的文字。


特征

符号性和系统性

首先,语言是社会约定俗成的表达观念的符号,符号的本质是社会的。它在某种程度上要逃避社会上某一些小集体,小圈子的意识。这是语言最主要的特征。语言是一种社会契约,一个社会接受一种表达手段而排斥另一种表达手段其实都是社会上的集体意识的习惯。或者可以说,没有好坏之分,关键是使用那一种表达方式。

语言符号是一种包含着两面性的实体。一方面语言是表示事物的名称的,所以任何语言都是概念的映像,即具有所指性;另外,语言要依托声音,这种媒介来表达所指,所以说语言也是声音的映像,声音是语言的另一个侧面,也就是说语言具有能指性。

任意性和线条性

所谓的任意性是指语言符号和文字能指所指之间是一种任意的连接关系(是不可论证的),即使有的可以论证,但是在普遍意义上来讲,还是不可论证的关系。这就是世界上的语言为什么各式各样的原因之一。

所谓的线条性是指语言的能指是依托声音来完成的,所以他只能在一维的声音的空间里传播,而不能突破声音的范围和能力,所以说在分析语言的时候语言使能在横向上依照词语出现的先后顺序来完成,这也造就了语言使用和表达的局限,但是语言的声音性,决定了语言的线性是不可消除的必然结果。

不变性和可变性

语言是一个处在不断地运动变化发展之中的体系,这个体系中的各个要素既有一定的稳定性,也有一定的变动性,稳定性是语言系统的已存在的前提,也是语言自身被大规模研习使用的必备条件,而变动性不仅仅是作为一个系统,语言内部的不断衍生、发展的规律所致,而且也是语言的传承性的表现。任何事物都是不断的运动变化发展的,新事物不断地产生,旧事物不断地消亡。语言也是这样,语言系统的变化虽然不是很明显,速度并不是很快,但是受到使用的推动以及社会、文化等等很多因素的影响,语言本身在不断的向着经济、简练、实用、包容力、表现力强的趋势发展。

语言内部的各个组成部分都有着不同方式、不同形态的变化,而且变化的多少快慢也是不一样的,但是在以往的研究中,我们逐渐掌握了越来越多的规律来解释、预测语言的变化。这不但体现了人们对于语言学的关注、探索取得了很多的成就同时也昭示了语言学的变化性还是有据可依,有律可循的。

传承性和交际性

语言从某种意义上来看,是人类文化得以传承和储存的有效载体。因此,它在自身的发展当中,逐步体现出很强的传承性和交际性。

所谓传承性,是指语言以自己的风格特色吸引或者促使人们在生活生产中自觉不自觉地通过语言这个工具直接或者间接影响着相关的人群,或者波及其他更广泛的区域。达到传承的效果。另外,语言在人类社会发展当中,不仅在人与人之间,古代人与现代人之间,中国人与外国人之间储存了文明的精华信息,承担文明发展的桥梁,同时,也由于语言本身的强大交际性功能,更显示出独特的交际功能,在丰富的交际中应对各种变化,产生更加有表达力的语言,产生更多的基于生活生产实际的意义。

表征 

语言表征】就是语言材料所负载的信息在头脑中存在的方式。语言的表征具有层次性。


加工

语言加工】就是对输入的语言信息进行编码、转换、存储、提取的过程。语言的加工可分为自动加工和受控制加工、系列加工和平行加工、模块化加工和交互作用式加工。


生理机制

1、语言的发音机制:呼吸器官喉头声带,口腔、鼻腔和咽腔。

2、语言活动的中枢机制:布洛卡区威尔尼克区角回

(1)布洛卡区病变引起的失语症通常称为运动性失语症或表达性失语症。

(2)威尔尼克区病变会引起接受性失语症,这是一种语言失认症。切断或损伤威尔尼克区与布洛卡区联系起来的神经纤维束-弓形束,也将产生同样的效果。

(3)角回实现口语和书面语言的转换。角回损伤将会引起语义性失语症。

3、语言在大脑两半球的一侧优势与语言活动。(割裂脑的研究),研究证实语言活动主要是大脑左半球的功能,但大脑右半球在语言理解中也有重要作用。


语音知觉

1、语音的物理性质:音高、音强、音长与音色。

2、音位是在一种语言中能够区别意义的最小的语音单位。音位分元音辅音。研究音位的区别特征有助于解释人对语音的感知。影响语音知觉的各种因素有:语音类似性,语音强度,噪音掩蔽,语境,句法、语义的作用。

3、影响词汇理解的因素:单词的部位信息、正字法规则字母长度或笔画数量、字形结构、字词的使用频率、语音的作用、语境的作用、语义的作用。

4、影响句子理解的因素:句子的类型、词序、语境、句法分析和语义分析。

5、影响话语理解的因素:推理、语境、图示作用。


语言起源

大致可以分为神授说和人创说,劳动创造说。


二、什么是自然语言?


自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人造语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。 自然语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的,也是各国人表达的方法其中之一。


简介


自然语言通常是指一种自然地随文化演化的语言。英语、汉语、日语为自然语言的例子,而世界语则为人造语言,即是一种由人蓄意为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人造语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。


发展


随着计算机和互联网的广泛应用,计算机可处理的自然语言文本数量空前增长,面向海量信息的文本挖掘、信息提取、跨语言信息处理、人机交互等应用需求急速增长,自然语言处理研究必将对我们的生活产生深远的影响。

自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的。随着计算机和互联网的广泛应用,,也随之衍生出了一系列的产品。相对而言,截止到2012年,国外在该领域的研究投入和成果都相对领先于国内,尤其汉语天然就相对于其他语种更为复杂,更为难以分析。

特点

自然语言处理发展的4个特点:

1. 基于句法—语义规则的理性主义方法受到质疑,随着语料库建设和语料库语言学的崛起,大规模真实文本的处理成为自然语言处理的主要战略目标;

2. 自然语言处理中越来越多地使用机器自动学习的方法来获取语言知识;

3. 统计数学方法越来越受到重视;

4. 自然语言处理中越来越重视词汇的作用,出现了强烈的“词汇主义”的倾向。 

VB

在Visual Basic中 自然语言是指人类语言。是描述算法的一种方法。

缺陷

与自然语言相对的是逻辑语言。自然语言是人脑与人脑的交际工具 ,逻辑语言是人脑与电脑的交际工具。认知科学认为,思维和认知是知识的逻辑运算,任何计算化的自然语言分析都主要依赖逻辑语言对这种分析的表述。研究心智表现及其运算的认知科学理论追求的是心智研究的物质体现,这最终将导致语言学研究进入自然科学研究。自然语言的高度形式化描写对计算机程序的机械模仿至关重要,但理解力模仿不同于机械模仿,它们之间的区别非常类似自然语言中形式操作与意义操作之间的不同。机械模仿涉及的是形式性质,而理解力模仿涉及的却是准语义性质。现阶段计算机以机械模仿为主并通过逻辑语言与人类的自然语言对话。

现代逻辑作为分析自然语言的工具,认为自然语言的缺陷有:(1)表达式的层次结构不够清晰;(2)个体化认知模式体现不够明确;(3)量词管辖的范围不太确切;(4)句子成分的语序不固定;(5)语形和语义不对应。

从自然语言的视角衡量逻辑语言,其不足有:(1)初始词项的种类不够多样;(2)量词的种类比较贫乏;(3)存在量词的辖域在公式系列中不能动态的延伸;(4)由于语境的缺失而使语言传达信息的效率不高。


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/R1uNW1W/article/details/79683747

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf