利发国际-业界公认的最权威网站,欢迎光临!

利发国际_利发国际娱乐_利发国际平台

当前位置: 利发国际 > 语音识别原理 >

不是因为我是做模式识别的才说模式识别重要

时间:2018-04-16 02:59来源:明星经纪人 作者:梅林小栖 点击:
说得不对的地方请。 更多精彩内容请关注: 而且重新利用海量的互联网数据是特别值得关注的研究方向。我的发言就到这里,注重数据与知识相结合,注重结构与统计相结合,向生物

  说得不对的地方请。

更多精彩内容请关注:

  而且重新利用海量的互联网数据是特别值得关注的研究方向。我的发言就到这里,注重数据与知识相结合,注重结构与统计相结合,向生物系统学习,瓶颈需要突破,这三性是三个硬骨头。特别是基于生物极机理的模式识别值得大家关注。

模式识别非常重要,我认为这5个方向,鲁棒性、可泛化性、可适用性。另外依据我自己的浅见,现状就是在我们目前有三根硬骨头,包括它的目前现状,特别是我简单回顾了一下模式识别几十年发展的历程,我也知道今天在座的同行们不一定完全都是做模式识别的,首先给大家介绍一下模式识别的基本概念,它在很多方面都是在讲模式识别的问题。

今天我就利用这点时间,它是需要数据的挖掘、模式识别和分析。所以去年IJCAI有一个文章发表,反映什么样的态势,互联网上这么多的信息,同时互联网上很多的任务需要模式识别完成,同时整个模式识别系统流程完全基于互联网信息,对于推动模式识别的研究和发展非常重要,怎么样把互联网的海量数据充分应用起来,所以可以说是人类智能+机器智能的混合载体,有大数据、知识、交互、众包等等,所以数据和知识相结合非常重要。

第五个是以互联网为中心的模式识别。互联网上有太多的数据,数据和知识相结合也是一个非常重要的发展方向,把知识传递到下一层,也就是说从上一层的信息传递到下一层,是因为。我提到了反向链接,我前面讲到借鉴神经回链接的过程中,但是数据不是一切,数据当然很重要,现在大家都强调数据的重要性,这个也好理解,有的时候不可解释。

第四个方向是数据和知识相结合,而且原理不清晰,但是它对数据质量要求高,但是它没有充分利用所有的数据。统计模式识别应用范围光,样本要求也少,描述很紧凑,因为统计方法和结构的方法各有自己的优缺点。结构方法的原理很清晰,目前的研究还不是太多,但常有效。这是第二个重要的方向。

第三个是结构和统计相结合的模式识别新理论。这是一个值得关注的发展趋势,这个非常简单,这就是定序测量,可以产生很多的1和0,然后在不同的区域里面移动,如果比它暗计为0,或者A区域比B区域更亮我计为1,如果A区域的灰度低于B区域,A区域和B区域相比,在图象里面找两个区域,但是重多少、轻多少你就不好判断了。在图象里面也是如此,哪个轻你很好判断,听听语音识别原理框图。这就是定序测量非常重要的一点。假如给你两个球掂量哪个重,稳定就是很鲁棒。定量的比较慢而且不稳定,另外你今天给的答案可能和昨天给的答案不一样。定性的比较既快又稳定,或者你只能随便说一个数据,你可能瞬间没法告诉我,瞬间你就知道是姚明高。但是我如果问你姚明比那个人高多少,这个问题太简单了,我如果问大家谁高谁矮,姚明和他的一位朋友,学会python语音识别模块。这个特征叫定序特征。什么叫定序特征呢?比如说这两个人,非常简单的特征常有效的,有的同行可能听我在其它场合讲过,举个例子,我们提的一个叫定序测量特征。我们发现这个特征很鲁棒,我们现在还在用,这个工作已经有些年头了,这就是鲁棒要解决的问题,其实重要。在跨、多源异质的视觉大数据中找到具有较好泛化星和不变形的表达,人脸的识别也跟随变化,你的光照变一点、姿势变一点,当然解决鲁棒问题另外一个出就是找到鲁棒的特征。比如说人脸图象,所以解决鲁棒问题很重要,基本上就没什么用,如果你的算法不鲁棒,鲁棒性是我们经常碰到的,这些我是赞同的。而现实生活中,计算机视觉的问题也就都解决了,对于不是因为我是做模式识别的才说模式识别重要。如果鲁棒性的问题解决了,我认为这是解决那三个性的瓶颈的重要的途径。

我前面讲了鲁棒是一个硬骨头,我也简单提一提。因为我今天重点是要讲生物的模式识别,就是基于生物的模式识别方法。

值得关注的方向还有四个,然后从结构到统计相结合的模式识别方法,所以它是一个从统计到结构,然后用这些规则来进行识别,所以从统计方法获得规则,规则是结构模式识别所需要的,学习了规则,它是典型的通过统计的方法,可以了解这篇文章,如果大家有兴趣,这是小样本学习,后来再看到更多的苹果他都能识别,就像前面讲的一个小孩看到一个苹果,来模拟人从机器少量的数据里面来学习知识,试图克服深度学习对大量大样本训练数据的需求,当时还引起了小小的轰动,在自然上发表了这样一篇文章,2015年底的时候,语音识别算法有哪些。这是我的团队中的一个教授做的工作。

这是我今天要给大家报告的值得关注的模式识别研究方向的第一个重要方面,说明它的网络生成的数据还常靠谱的。因此它可以用来训练你的网络,还是右边是计算机生成的,你根本看不出是左边是计算机生成的,如果不特别仔细看,中间是输入的,另外一组是生成的,其中一组是原始的,每组左边一列和右边一列,这里一共有四组图象,这是输入图象的侧面,主要是说明通过网络生成的图象非常逼真,我们也做了一些工作。大家看这几组照片,同时可以提高算法的垄断性和泛化能力、自适应性。现在大家非常关注这方面的工作,一方面可以解决小样本的问题、训练数据的问题,它是通过产生更多的原始数据样本分布一致的大量的深层数据,现在这一点很火,计算机也能做得很好。

还有一个是概念学习,基于这样的机制,这是我们人都能做到的,来有效识别你所看到的物体,也就是先验知识和数据的结合,再结合现场观测到的信息,在识别一个东西的时候我们会用大量的先验知识,也获得了很好的效果。

还有生成学习,他把迁移学习的概念用到手写识别上,说不定网球打起来也会学得更快一点。这是我的一个做手写识别的同事,如果你的乒乓球、羽毛球打得好,这一点也是我们人具备的,这个无人机通过跟的交互自动学习找到一个可以穿过去的地方。

还有一个是知识学习。人有这个本领,想知道语音识别技术原理。从而增强对的自适应性。这是我们自动化的同事做的几个简单的演示,通过跟交互来学习,我会主动的动一动,那个地方看不清楚,获取知识至关重要。我经常讲如果我站在这个地方,对我们获取外部世界的信息,我们在成长的过程中跟的交互,这里我特别要说的是跟的交互,人的学习就是这样的机理。这个研究是试图借鉴人从小到大学习过程的机理。

还有迁移学习,在积累的过程中拓展学习范围,学习的效果有生成学习、概念学习。

强化学习这一点大家都非常熟悉,方法有迁移学习、知识学习,特别是学习过程的行为有什么机理值得我们学习?我前面讲到机理方面学习的借鉴、过程方面的借鉴、方法方面的借鉴。学习的过程有发育学习、强化学习,人的行为,后面还有四个。

模仿生物从简单到复杂的学习过程,现在讲这一个,我今天重点讲生物的模式识别,我就不展开讲了。

宏观层面就是行为层次,计算机视觉里面用得比较多,很容易找到这篇文章。记忆和选择性机制、注意机制,学习ld3320语音识别模块。大家如果有兴趣,这也是我的一个学生做的,这个比较好理解,这个效果非常不错。

最后一个是学习机制。值得关注的方向,一负责获取运动信息,一负责挖掘表观信息,他们借鉴这个机理提出双同的卷积网络,还有一个腹侧通,大家知道视觉通有一个背侧通,也取得不错的效果。

注意和记忆机制的研究比较多,把不同的脑区的功能协同机制借鉴到多任务训练学习方面,也有很多值得我们借鉴的。这是我的一个学生做的研究,或者不同的脑区协同完成一件任务,中间怎么协同,在不同的脑区有不同的功能,就是更宏观的区域,发现效果也非常好。

再一个是多通道协同,试图通过反向链接把高层的信息往低层再传递,是我的一个博士生做的,它确实可以提升兴奋。反向链接是我们自己的工作,这是我引用大学的教授发表的文章,就是在同一层的侧向链接,包括AlexNet和VGG都是前向链接的。这里我要重点说的是侧向链接,现在大多数的深度学习都是前向链接的,有前向链接、反向链接和侧向链接。这是大家都非常熟悉的前向链接,Bengio借鉴这个机制发现确实能提高兴奋。

另外一个层次是功能区域,特别是神经元可塑性机制,解决了神经元的机制问题。神经元的放电效应也不一样,从一定程度上解决了小样本的问题,不是因为我是做模式识别的才说模式识别重要。提升了网络的效率,暂时简化了网络结构,在渲染过程中有的隐藏节点不考虑,他模拟神经元的噪声特性,它有多种类型。我想Hinton教授大家很熟悉,同时神经元的类型可以自动学习获得。所以深度神经网络不是单一的类型,它的效果有不同的提升,引用不同类型的神经元,这边我了今年我的同事发表的一篇文章,有的是型的,有的是兴奋型,我前面提到了它有不同的类型,所以在这几个层面有很多东西值得我们借鉴。

在回这个层次,还有学习的效果也可以借鉴,学习的方法我们可以借鉴,别的。学习的过程我们可以借鉴,在学习机制方面,我们人是怎么学习的,不同脑功能区的协同等等。

比如在神经元层次,可以有多脑区,实际上在人的大脑上上还有后向和侧向的。还有更宏观的功能区域,ld3320对比讯飞。目前绝大多数都是前向链接,比如说深度学习、深度神经网络,同样有很多值得我们借鉴的东西,神经突触有功能可塑性、结构可塑性等等。这是在最微观的神经元这个层次。

最后最宏观的就是在行为层次的学习机制,在这里面如何把神经元得到体现,它有兴奋性、有性的,神经元有很多不同的类型,它的链接就更多了,我们的大脑有1000亿个神经元,我每一块都提一两个代表性的工作。当然最微观的层面,怎么去建模,至于怎么去尝试,能够值得我们尝试一下,有哪些机理能够值得我们借鉴,我今天主要是给大家报告一下在这四个层次,所以这是不同的问题,怎么再嵌入到模式识别的算法里面,然后怎么对它们进行建模,需要借鉴首先要知道有哪些东西可以值得借鉴,从微观到宏观都有一些值得我们借鉴的机理。当然,语音识别技术原理。我把它分了四个层次,从哪些方面可以借鉴人类大脑或者生物系统有哪些方面值得我们学习,实际上都是从大脑获得的。

在神经回这个层次,当然还有显著性、注意机制等等。包括我们现在的深度学习、多层网络,形成了纹理分析的很经典的方法。我主要说明从生物学习、人的大脑机制学习的有效性,当然后人也做了很多的工作,我发现效果非常好,所以我当时做博士论文的时候用了这个函数,通过这个函数发现人的感受和Gabor函数非常相似,当时我用得最多的就是Gabor函数,很多方面受益于生物机制的。比如说我博士时期做了纹理分析,他们都是说明向生物系统学习的重要性。历史上模式识别与计算机视觉的发展,一个是家,一个是科学家,我引了两个人的话,今天把它的有些内容再说一说。自然界生物系统有太多的机理值得我们学习,我首先是生物的模式识别。上次我在还专门就生物的模式识别做了一个发言,我认为第一个值得关注的就是怎么突破那三个瓶颈,我也是要求我的学生这么做的。

我下面简单地给大家报告一下,至少我和我的学生是这么想的,这是模式识别下一步特别要关注的方向,这样的系统还任重道远。鲁棒性、自适应性和可泛化性是进一步发展的三大瓶颈。怎么在这三个方面有所突破,这也是大家需要思考的问题。如果需要,关键问题是我们需不需要通用模式识别系统,深度学习开创了新局面。通用模式识别系统依然任重道远,甚至超过人。你看模式识别。统计与基于神经网络的模式识别目前占主导地位,有的性能可以与人媲美,第一是面向特定任务的模式识别已经取得突破性的进展,我对它的现状有几个概括,所以这方面是模式识别下一步要啃的几个硬骨头。

也是值得关注的方向,计算机视觉几乎所有的问了都解决了。我对这个观点是赞同的,如果不考虑鲁棒性的问题,他说计算机视觉根本问题是一个鲁棒性的问题,著名的计算机视觉专家,当然人是可以解释他的结果的。

模式识别发展到今天,它没释它得出的结果,我个人认为它还是一个黑箱模型,但是深度网络,大家都知道深度学习很好,所以怎么样让我们的计算机模式识别方法能有这样的泛化能力就非常重要。

RobertM.Haralick,这个泛化能力非常了不起,他都知道是苹果,什么样的形状,其实不是。以后不管他碰到什么样的颜色,只要她妈妈告诉她这是苹果,小孩子看了一个苹果,所以我们需要大样本的高质量的训练数据。人通过看书就可以学习,但是机器不行,这是鲁棒性的问题。

还有可解释性差,在嘈杂的下机器识别还是比较差的,但是都是没有办法完全解决。语音识别也是一样的,这都是计算机视觉里面常见的干扰,还有遮挡、光照、背景凌乱的影响,它会把凹进去的东西看成凸出来的,它的光照变化,让它识别不出来。

还有可泛化性差。人有举一反三的能力,或者人工有意产生的这些图象,这是特意叫人工合成的,当然要特别说明一下,它在鲁棒性方面、算法性方面还有问题,这说明深度学习的问题,它会把不是的东西识别成是,但是目前深度学习没法把这一列的图象正确的识别出来。是的东西它不能识别成是,大家都会识别出来是一辆车,如果看这两个图象,对于你我来说,我再讲一句,不熟悉的,再温习一下,如果大家熟悉的,我提一提,其实语音识别技术原理。这些例子大家都很熟悉,包括老年痴呆的人走丢的寻找。

所以计算机视觉的鲁棒性是很大的问题。比如说它的旋转性,一两米远也是可以的。最近我们的虹膜识别技术用在寻找丢失儿童,当然不是远到几十米,远距离也可以,现在不光是近距离,这也是我过去20年主要的研究方向,虹膜是一个圆环区域的结构,比如说在煤矿上的应用,我只是想告诉大家在模式识别领域确实取得了很大的进步。首先有近距离的虹膜识别,无意为我的工作做广告,我这里举的是几个例子,包括有时候父子长得很像也不太好识别。所以我这些年又在研究虹膜识别,比如说双胞胎识别就是一个问题,当然不敢说人脸识别已经能完全解决问题,包括商汤科技这方面都是做得不错的,识别翻译的非常好。在人脸识别领域,我这里有一个语音识别的视频,当然我无意比较搜狗的语音识别和科大讯飞的语音识别谁好谁差,大家已经能够看到,我暂且把它叫做专用模式识别。

我前面提到了深度学习,计算机模式识别已经取得了巨大的进步,主要说明对一些特定的模式识别问题,我这边可以举几个例子,大家每天都会接触到模式识别的应用,到后来我严重的非常多的模式识别的领域,从最早的字符识别,特别是在领域方面的不断地拓展,在推动它的发展方面发挥了特别重要的作用,都是模式识别典型的问题。也就是说模式识别这些年的发展,图象识别、语音识别,比如说大家非常熟悉的早些年的VOC,很多方面都是模式识别方面的突破,很多方面都是因为在模式识别得益于深度学习的发展,人工智能的热潮,想知道语音识别算法有哪些。大家仔细想想这些年深度学习的热潮,这方面非常多,应用不断地拓展,都不能相互取代。

比如说语音识别,它们各自都有各自的优缺点,当然也有人把神经模式识别算为统计模式识别,模式识别应该说进入了新的发展时期。所以无论是统计模式识别、句话模式模式识别还是神经网络模式识别,以深度网络为代表,当然中间也有交替。所以发展到今天,大致上的理论创新是这样的脉络,后来又有了神经网络,句法模式识别也曾经流行过一段时间,后来又有句法模式识别,所以统计学首先兴起,比如说统计学等等,从最早受益于数学的基础,中间历程也在不断创新,都走过了长达半个世纪的发展历程,还是从计算机的诞生算起,也是国家第一批设立的模式识别重点实验室之一。科大讯飞语音识别模块。

在理论创新不断取得突破的同时,我所在的国家重点实验室在国家自动化所,包括CCS也有一个人工智能和模式识别的专委会,还有这里面最重要的一个组织是IAPR。国内也有很多这方面的组织,时间关系我就不全面展开讲。值得一提的是我们这个领域最悠久的刊物PatternRecognitionLetters,不得不提到相关的和组织,所以我笼统地把它分为三个大的阶段。

模式识别无论是从第一个OCR的专利算起,特别是方式方法上有一些新的突破,掀起了模式识别的新的热潮,特别是2010年以后深度网络学习的兴起,进入到新的时期,各种各样的方法蓬勃发展,第二个阶段是从上世纪70年代到初,第一个阶段是从数学基础的出现到上世纪60年代末,我大概分为三个阶段,计算机识别到现在也就有70年的历史。从它的发展阶段,那是上世纪40年代的,如果以第一个PatternRecognition专利为例的话,我没有找到,语音识别算法。涉及到非常多的领域。我也试图查了一下PatternRecognition(模式识别)这个词是什么时候出现的,它涉及到形式逻辑、运筹学、认知科学、神经科学和统计学的领域,模式识别是模拟人的识别能力。从它的发展来说,所以应该说模式识别是人工智能一个非常重要的研究方向和研究领域,模式识别世界上是模拟人的识别能力,人工智能是模拟人的智能,机器的模式识别能力反映了及其只能的未来方向。

当然说到模式识别的发展和历史,他说模式识别是人类最重要的智能行为,但是他的这个观点我是认同的,尽管他的很多观点我不认同,未来学家RayKurzweil,对比一下python语音识别模块。它是人类最重要的智能行为。所以机器的模式识别能力反映了机器智能的类人程度。

大家知工智能到现在已经有61年的时间,它确实重要,不是因为我是做模式识别的才说模式识别重要,然后进行识别。这是一个基本概念,显性的特征或者隐性的特征,当然你可以进行特征抽取,然后再把它进行特征描述,把这些数据进行了预处理,找到苹果在哪个地方,要把苹果树拍下来,比如你要识别苹果,首先是要获取信号,都有这样几个步骤,但是不管它是什么样的定义,大家看到有非常多的定义,还没有找到一个标准的定义。所以我在这里列出了一些模式识别的定义,但是我这么多年做模式识别研究,它不是一个新话题,它本质上讲是要找到一个影射的过程。尽管模式识别是一个非常古老的话题,模式是存在于时间和空间中具有可观测性、可度量性和可区分性的信息。识别是对各种有形的模式进行识别。

美国的发明家,包括在隔壁房间的同仁们并不陌生。模式识别是PatternRecognition,今天我也做了一些更新。

模式识别大概的步骤大家都知道,有的内容在其它场合也讲过,我觉得特别值得关注的几个研究方向,对比一下python语音识别模块。大家可以会后再了解一下。

模式识别这个概念对于今天在座的,我一般都会把这方面代表性的文章列在后面,不讲具体的算法,所以我更多的是一个情况的介绍,模式识别下一步有哪些方向值得研究,在人工智能非常火爆的时候,特别是在大数据时代,让大家了解模式识别目前的现状,我是希望通过这个发言,让我们热烈欢迎谭铁牛院士。

我今天主要讲三个方面的内容。第一是简单回顾一下模式识别这几十年的发展。第二部分说说模式识别的发展现状。第三部分是以我个人的视角,现在是中国图象图形学会理事长、中国人工智能学会副理事长,发表专著多项发明。获得了一系列的国家级的,他从事的专业是图象处理、计算机视觉、模式识别等等一系列跟人工智能相关的研究,当然我对他了解的是他在模式识别实验室工作期间,其实模式识别。我就不一一介绍了,头衔非常多, 我今天不会讲具体的算法,谭教授是中国科学院院士、英国皇家工程院外籍院士、发展中国家科学院院士、巴西科学院外籍院士,


学习语音识别原理 (责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
最新评论 进入详细评论页>>
推荐内容