��ǰλ�ã� ��> ��YӍ> �C��֪�R> ��Ȼ�Z��̎��g��g�Mչ��Ĵ��c�aƷ

��Ȼ�Z��̎��g��g�Mչ��Ĵ��c�aƷ

��Դ�� Y�C��݋�� r�g��2020/6/23 ��}�� [ ��]

��Ȼ�Z��̎��g�đ��ú��о��I��l��S��x�Ę��I��¼��҂��ġ��g�Mչ��c�aƷ��ɴ�S��M�л��

2019 �꣬��g�Mչ��I��Ҫ�w�F��AӖ��Z��ģ�͡��Z�� NLP/�o�O��C��g��֪�R�D�V�lչ + ��Ԓ��g�ںϡ��˙C��ƽ̨�S��AI�aƷ��

1 �AӖ��Z��ģ��

�S�� 2018 �� Google ��AӖ��Z��ģ�� BERT��ڶ�� NLP �΄��ϫ@�ø��Ч��AӖ��Z��ģ�͵��о��c��ñ��W�g��͹��I��ҕ�� NLP �I��һ��ش�ͻ�ƣ�� NLP ��}�Ľ�Q��ʽ��Ğ�ÿ��΄ՆΪ��OӋ�}�s��ģ��u��׃��AӖ�� + ΢�{�Ĺ�ʽ��׌�� NLP ��܉��ܵ��Z��AӖ��ģ�͎��ļt��ͨ�õ��AӖ��ģ�͵Ļ��A�ϼ��뺆�ε��΄Ռӣ��K�Y��Լ��Z�ϾͿ��ԫ@��һ��e��I�� NLP ģ�͡�

��_��Ȼ�Z��̎��ƪ�¡�

�� 2019 �꣬��о��C��͹�˾�� BERT �Ļ��A��Mһ��£��Լ��AӖ��ģ�ͣ��磺Facebook �l�� RoBERTa��CMU �l�� XLNet��Stanford �l�� ELECTRA��߀�аٶȵ� ERNIE ģ�ͣ��Y�� structBERT ģ�ͣ� �A�� NEZHA��Ϳƴ�Ӎ�wҲ��Լ��ģ�ͣ��ˢ�� NLP �΄յ��óɿ��

�@�µĹ��Y��Ҫ��Ӗ��΄��OӋ��Ӗ��㷨�ɂ��I��

Ӗ��΄��OӋ

�M�и��Ӿ��Z�x��Ƚ�ģ��ȵĽ�ģ��͸��Ӿ��Ŀ̮��Z�x�P��

�� ȫ�~ Mask�� Knowledge Masking��g�� MLM �AӖ��΄�� Mask ��~��ǆ΂� Token��M��΄��y��ʹ�� BERT �W��Z�x��Ϣ,��Ϳƴ�Ӎ�w�ϰl�� BERT ģ��Լ� NEZHA ģ��еõ��ˑ��ã��ٱ��͵ľ��g�P�S��Ķ��܉��Ӝʴ_��Z�x�P�ԣ��M��Z�xƥ��ȷ��I��@�ڰ��Y��Λρ�F꠵� BERT ģ��еõ��w�F��

��µęC��W��ģ

�� CMU �� Google �ϰl�� XLNet ʹ�� Autoencoder �� Auto-regressive �ɷN��˹̹��W�� ELECTRA ģ�ͣ��댦��C�u��M�и��õ� MLM �W��Aʢ�D��W�� Facebook �ϰl�� SpanBERT ģ��߀�� Span �A�y�΄ա��@Щ��ø��W��ģ��֮�g��S��Ķ��ģ��Ч��

Ӗ��㷨�OӋ

ᘌ�ģ�͵��ԵĆ��}��p��ģ�ͅ��߽��ģ�͵��}�s�ȣ�� Google �l�� ALBERT ʹ��~�� embedding ��ꇵķֽ��c��g�ӵĹ��

��Ӗ��ٶȵă��

��Ͼ��Ӗ�� FP16 ��M�Й��أ����ݶȵȵı�ʾ��LAMB ��ͨ�^һ��m��ʽ�ķ�ʽ��ÿ��{�� learning rate��ģ��Ӗ��܉��úܴ�� Batch Size; �@Щ��O��Ӗ��ٶȡ�

��Y�� structBERT ģ��ͨ�^��ģ�ͺ��΄սY��Ϣ��Z�Ա�ʾ��Gluebench mark �϶��ǰì�ͱ��I��λ�á�ͨ�^��s�� CPU ��٣�RT �� 10x��finetuned ��ģ�ͽo��I�Ո��@��Ͼ�� AliNLP ƽ̨��

�AӖ��Z��ģ��ڴ�Ҏģ�o�O��ı��M��AӖ��õ��~�;��ӵı�ʾ�w�Ƶ��V��[�΄��ϣ��ı�ƥ�䣬�ı����ı��ȡ��x��⣬�C��Ȳ�ͬ�Ĉ��簢�Y�Z��ģ�� MS MARCO ��u�y��TREC Deep Learning �u�y�϶�ȡ��˵�һ��ĺóɿ��

��[��΄տ��ڵ��YԴ��r�¿��٫@��һ��e�Ľ�Q��O�� NLP �㷨�đ��

2 ��Z�� NLP/�o�O��C��g

��AӖ��Z��ģ�͵ĔUչ��Facebook ��о��ˆT��˿��Z�Ե��Z��ģ��AӖ�� Cross-lingual Language Model Pretraining��Hʹ�Æ��Z��ğo�O��Ӗ��ʹ��ƽ��Z�ϵ��бO��Ӗ��ėl��£�ģ��Ч�W��˿��Z��ı��ڶ��Z�Է�͟o�O��C��W��΄��ϣ��֮ǰ���Y��@��

�^ 2018 �� Google �AӖ��Z��ģ�� BERT �M�� NLP �΄�֮�ᣬ2019 �� Facebook �l��Ϳ��Z��AӖ��Z��ģ�� XLM��F��ͬ�Z��ڽyһǶ��g�ı��K�ڟo�O��C��g�΄��ώ��@��|��̽��Ҏģ��Z��񽛙C��g��ϣ�Google��Y�Ͱ͵��M��Ч̽��ͨ�^ͬ�r�ڔ�ʮ��ٷN�Z��ƽ��Z��Ӗ��һ��ģ�ͣ��ǌ��Z��քe��ģ��F�Z�xӳ��P�S��H��s��ģ�͔��ͬ�r�ձ��С�Z�N��gЧ��

�^ȥһ��Z�� NLP ��g��о��ɹ��Ҫ��ڙC��g��؄e�ǟo�O��ęC��g��Z��~��Z�� NER��䷨��~��R�Ͷ��Z��~��ɵȷ��

��춿��Z��~��ČW��/ӳ��е��P�I��E��Ŀǰ�ğo�O��/��Z�Ե� NLP �΄��Z��֮�g��Ӣ�Z/��Z��Ӣ�Z/��Z�ȣ�Ч��ã��ڲ�ͬ��Z�Լ��g��Ӣ�Z/Խ��Z��Ч��߀��^��g��

3 ֪�R�D�V�lչ+��Ԓ��g�ں�

�S��ķe�ۺ͑��Ì��|��ͽY��Ҫ��֪�R�D�V�ֳɞ�һ헟��c��g�_ʼ��Pע��

֪�R�D�V��g�I�� 2019 ��İlչ��I��֪�R�D�V�Ę��ϣ��ڡ��I�ȣ��D�Vƽ̨��˜��Ľ��O��schema ��x + �� + �{�ã��D�V��㷨��O��춈D�V��ĈDģ�� + Ҏ�t��ȣ��K��춘��ĈD�V��_ʼ�ڸ��ĘI�Ո��õ��ã��]��ھ򡢽��L�غ͛Q�ߡ��Ԓ��̓��ɵȣ��

��֪�R�D�V�͌�Ԓ�Y�ϵļ��g��򣬌�Ԓ��g�چ��΄�ʽ��Ԓ��γ��һ��ļ��g��ܺ͘I�ո��w��_ʼ��Ҫ��QһЩ��֪�R�� + �𰸌��I��Ҫ��ߵ��I��ؔ��ȣ��

��Ԓ��g�Y��֪�R�D�V��I��֪�R�� + �Y��|��݁��M�и��w��Խ�Q��Z�Ϙ�ע��D��⣩�͌��ã��Ԓ�� + 푑��ɣ��ϵĲ��㣬�Mһ��Ԓ��w��푑��|��ں�֪�R�D�V��Ԓ�@�� 2020 ��и��挍��غ͸��w��

4 ��˙C��

��Ȼ�Z��Ȇ��ƥ�似�g�ڌW�g�͹��I��m�l�lչ��K��ѽ��ȫ��I�պ͈��˴�Ҏģ��ã��AӖ��Z��ģ��Mһ��ܵ��

�C��x��ɞ�ͳɱ�ͨ�ü��g��@�ٿơ��߷�Ҏ��ƷԔ��퓡��f��Ȉ��̨��Ч��˺ܴ��Y�ψD-�ĵĶ�ģ�B VQA ��g��ИI��ȷ��ƷԔ��L�D�M�І��ɞ�һ��µĸ��

��Ԓ��Dialog��g��Mһ��lչ��ڶ˵��˵Ļ�추��ӵČ�Ԓ��B��ۙ�͌�Ԓ��߀��b��޶��M��̽��I��춌�Ԓƽ̨��΄��͙C��˳ɞ��Č��F��

��Z�Լ��g��F��Z�ԵĿ��չ�� Cross-Lingual ��Z��Z��ģ�ͣ��h��x�Z�Ԍ��Ӣ -> �С�Ӣ -> ̩�h��x�Z�Ԍ��ϳ�Խ Google��չһ��Z�ԏ�ȥ�� 2 ��¿s�̵� 2 �ܡ�

��Ԓ��ɼ��g�_ʼȡ��ͻ�ƣ��춽Y��֪�R��ɵĿɿ��ԣ��u�c��Ɏ��팧ُ�D��ʵ��

5 ƽ̨�S��AI�aƷ��

�S�� AI ��g�lչ�� AI ��õ��AI ��g��ܵĳ��죨Tensorflow��PyTorch�ȣ��AI ��g��u��˜ʻ��һ�S�� AI ƽ̨aƷ��I��I��_�l�ߣ��ṩ��T��͸��Ч�ʵ� AI ��֧�֡�

��Ԓ�ƽ̨��Google �� 2016 ��_ʼ�l�� Assistant ��Ԓ��֣��@��m�l�� Google Home��F��ϵ� Nest ��ܼҾ�Ʒ�ƣ��Duplex �Z��Ԓ��Լ��ُ�� API.AI ��Ԓ�_�lƽ̨�� Google �ѻ��@Щ��Ԓ�aƷ��ˌ�Ԓ�F�е�ƽ̨ + �K�ˣ��F��һ��w�Č�Ԓ�aƷ��

AI �ƽ̨��I��Amazon �� 2017 ��l�� SageMaker �C��W��ƽ̨�aƷ��Mһ�� SageMaker �� AI �_�l�^�̣�ͬ�r��ͨ��[��g��ܺ��[ AI ��ã�� AI �aƷ��ư��Y�ęC��W��ƽ̨ PAI��λ��I��I��_�l�ߵ�һվʽ�C��W��ƽ̨��

2019 �꣬��c�aƷ��I��Ҫ�w�F�ڙC��g��Ԓ�S�y��݆��Ԓ��ܷ��ա��Z��ó��m�lչ��

6 �C��g

�C��g�ĮaƷ�lչ��m��֮ǰ��څ�ݣ��ͨ��I��ض��I��̣��t��ȣ��Uչ�˸��Z�Է��֧��˸��S��ĘI�Ո��K��m��̘I�rֵ��Y�Ͱ��ڷ��g��A��ܷ��M��׿�г�Ч��̽��јI��֪�R��õ��ںϵ��񽛾W�j��g��У��˴�ֱ��P�I��Ϣ�ķ��g�ʴ_�ʡ�

�߃rֵ�͸��Ѓ��ݵķ��gĿǰ��x��_�˹��Ӌ��C�o��g��CAT��㷨��F�˙C�fͬ��g��Լ��C��g�ᾎ݋��MTPE��aģʽ��Ҳ�ܵ�Խ��Խ��Pע��Y�Ͱ͡��vӍ��Ԅ��ᾎ݋��APE��ʽ��g��IMT��_ʼ�ЮaƷ�Ƴ��K�ڌ��H�I��ء�

��ı��g֮�⣬��Ķ�ģ�B��g��È��F��Z��g�ڕ��hͬ��p�Z��Ļ��g�CӲ��ϵć�ԇ��Y��ʮ��R�ώ��b��vҲ�Ԍ��r�p�Z��Ļ��ʽչʾ��

�Y�� OCR��C��g�ͺψD��g�ĈDƬ��g��֧��һ�ߣ�΢�ţ��ѹ��g�C�ϵõ��á��S��u��ֱ��d��ֱ��ҕ�l��g�Ĉ��Ҳ��Խ��Խ�ࡣ��ֱ��}�s��I�򣬌��I��g�Z��ٵ��Z�ٺ��Еr��s�ı��h��ֱ��g��Z��R�e�͙C��g��Ҳ�Ƿǳ��޴�

7 ��Ԓ�S�y

��Ԓ�S�y��Z�Ը��w�Mһ��춶��Z��w��չ�˷��Z��Z��̨��Ԓ�Č�Ԓ�S�y��Ŀǰ��֧�� 11 ��Z�N��R��Z-Ӣ�Z��̩�Z-Ӣ�Z�Ļ��Z��⣬�� Lazada �� AE ��Q�ʵĴ��

��Ԓ�S�y֧��˸��Ҏģ��̼Һ��I��֧��˳��^ 50+ �ļ��F��w�͑��С��չ��ͨ�ð��ИI��䁰��֪�R��λ��Ӌ��d��f��S�̼ң��վ�ǧ�f��Ԓ݆�Ρ��С�ۻ��I��d�� 40W �վ��S��I��

��Ԓ�S�y�Ľ��ʽ�Mһ��S��ֱ��С�ی��F�ˏ��Ʒ��P��}�ı��ӻش𣬵��Ӻ��Ñ�չ�_�_��ʽ��Ԓ��D׃�� cdau �ư��f��

VQA �ȶ�ģ�B��ص�С�ۼ��wС�ۣ��Ñ��w��ͬ�r��̼��óɱ��

�ᾀС�۵��Z��Ͱ��@ 2019MIT Technology Reviewer ʮ��ͻ�Ƽ��g��K��I��I��K�ڶ��Bݔ��

8 ��݆��Ԓ��ܷ��

��݆��ܷ��Ո��ͷ��C��ˣ��ڽ�Q�Ñ�ģ��}��Ñ�ʹ��w򞷽�I�𵽵��Ҫ��á�ģ��}ָ�Ñ��}�� N�_ͨ�� @��Ԓ�]��f��Ă��I�գ��@��}ռ�ͷ��C��˿��ᆖ�� 30%��

Λρ��ܷ��ՈF��OӋ�˻�춘˺��Ķ�݆��x��ھ�˺��K��ˣ��˺��I�՘˺��h��ý�...��V��˺��N�_ͨ��߀��...��ͨ�^��Ñ��˺��б��ʽ��Ñ��}��

��еĆ��}��巽��Ҫͨ�^ֱ��]��冖�}�ķ��xʲ�N�Ǻõĳ��冖�}��Ȼ��_��Λρ�F��OӋ��һ��춏��W��]�˺��б��ķ��}��壬��˺��]��һ��ЛQ�ߵ��^�̣��Ñ��c��˘˺�֮�ᣬ�҂��c��Ę˺��ԭʼ��Ñ��}һ��Ć��}��

��Ŀ��ǣ�Ŀ��˺��б팦��ڳ��冖�}�ĸ��w�ʣ�ͬ�r��ֲ�ͬ�˺��ڳ��冖�}��ϵ��Ч��֣��ˣ��ڏ��W��^��У��OӋ�˻��Ϣ��Ī��Reward��

��춏��W��Ķ�݆��Ͼ��ᣬΛρ�ͷ��C��ˈ��Q�� 33% ��ģ��}��C��˾C�ψ��D�˹��ʽ^��½� 1.2%��

9 �˙C��Ԓ��µĽ��

��ӵĂ��Ի��݆��Ԓ��g��˙C��Ԓ��U�䣬ͬ�r�Z��Z�xһ�w��Z�x��⼼�g��m��݆��Ԓ�_��ʡ�

��؈��`��^ȥһ��У��˙C��Ԓ��U�䵽��Ԓ��֣��Z��ُ���ʹ��}�s�Ľ��pʮһ��g��Z��ُ�� 100 �fӆ�ε�ӛ䛡�

��؈��`��ȥ�� 315 �Ƴ��˷��}�_�Ԓ�� _��ȫ�µ��˙C��Ԓ��Ñ��Ɍ�Ԓ�� Č�Ԓ��ڴ�ֱ�I��ȵ��_��ʽ��݆��Ԓ��Ŀ��ͨ�^��Ԓ��R�e��D��K��Ñ��@ȡ��Ҫ��Ϣ�� ҂��˻�춶�݆��Ԓ��ĵęC��x��⼼�g��D��P�I��Ϣ��춌�춁�늃��ݵ��⣬�҂�� Transformer ��ˌ�Ԓ��ģ�ͣ��x��Ժ��Ɍ�Ԓ��ᘌ� �� Č�Ԓ��҂��ʹ�ÈD�`�yԇͨ�^�ʁ��Ԓ��|��༴��Ԓ�ж��]��R��ǙC��c��ͨԒ�r��J�� ͨ�^�ˈD�`�yԇ�� Ŀǰ�ĈD�`�yԇͨ�^��_�� 87%��Ч�Ď��Ñ��İ��늣��ʡ�Ñ��r�g��

ͨ�^�˙C��Ԓ�ķ�ʽȥ��}�s��΄գ��c��ȡ�ُ��ȣ��Ҫ�C��Ñ��M�ж�Ό�Ԓ��ͬ�r�ڲ�ͬ��΄Ո��£��Ԓ�C��Ҫ��ո��I��֪�R��ܺ��Ñ􌦴��Z��ُ��؈��`�߂��ИI��܌�ُ�T��ո��ИI��ُ�T��N�۽�򞣬��Ñ��M��Z��ُ��ĕr��K�ĳɽ��D��Ŀ�ˣ��̈��N�ۆTһ��M�ж�݆��Ԓ��ʽ��ُ��ھ��Ñ�ُ��K�Y��Ñ��M�о��]��Ҍ��ͬ��Ñ��؈��`��Բ��m�� TA �Č�Ԓ��ʽ��Ի��݆��Ԓ��

��݆��Ԓ��_�ɣ��ǽ��һ�S�еĆ�݆��_�ɵĻ��A�ϵģ��w�΄յ��_��Ǻ��εĆ�݆�_��ʵĳ˷e�P�S��Ԓ��݆��Ԓ��_��ʌ��y��ƺ��γ˷e�P�S��P�I��춣�ÿһ݆��Ԓ��ĕr��Ҫ��Ϣ��

��؈��`�ϣ��҂��M��Z��Z�x��̽��Z��a�ĭh��҂��݆��Ԓ�У��ᵽ�Č��w��Ϣ�� memory��ͨ�^ attention �C�u׌��a��W�j��֪��@Щ��Ԓ��Ϣ��@��˶�݆��Ԓ��Z��R�e��ȣ�Ȼ��Z�x��h��҂��˾߂��݆ attention ��Ķ˵��^��ģ�ͣ��F��Ч�Č�Ԓ��}��Ķ�׌��϶�݆��Ԓ��e�`��½�� 58.5%��Ч��}�s��݆��Ԓ��ĔU�䡣

10 ��Z��ó��m�lչ

��䣬��χ��Ҷ��m�M��Ј��Amazon Alexa��Google Home/Nest��؈��`��С��С�ۡ��ٶ�С�ȣ��2019 ��M�븂��֣�2019 ��؛��Ȼ��ӣ��½��

��Ȼ��ŵ�ܛ����՞��Mһ��Ä��ه��ܼҾӺ� IoT �O��Mһ��ռ��

��Z��Ԓ��2018 �� Google I/O ��չʾ�� Duplex ��Z��Ԓ�� demo��2019 ��Z��Ԓ�_ʼ��ؑ��õ��挍�I��I�򣬰��N��ڡ��յ��I��đ��ö��L��Ñ��ո��w+��˹��ɱ��

Λρ��Z��Ԓ 2019 ��Ҳ�ڰ�ȫ��ڣ��U��L��΢�J��գ��֧��͑���ȸ��ڈ��ú��ء�

��Z����ã��I��Ñ��ه��Ԓ�Z��Ƅ�� NLP ��g��Z��g�İlչ��S��g�ͮaƷ�İlչ��죬�Լ��Ñ��ܶȵ��ߣ�2020 ��đ��Ҏģ��I��Mһ��U��

��Ȼ�Z��̎��g��g�Mչ��Ĵ��c�aƷ

��Ȼ�Z��̎��g�lչڅ��Mһ��Ƅ��˹��܏ĸ�֪��J֪��ܵ��M

�Ї��Ƅ��҃ȶ�λ��Ƥ��

��I�R�r��C��δ��lչ��ʬF��Щڅ��

��˲��C��Cosero��7��ɶșCе��b��Kinect��C��F��Ŀ�˭h��3D��֪

�Ƅ�ʽ��C��ƽ̨Personal Robot 2��ģ�M�_�T��̨��ͮ��

Jupiter��݆��D��ĵױP��UR5�Cе�۽M��ͨ�^SSD�W�j�z�yĿ��w

Ұ��r��̽�y�C��Robotanistʹ�ÔUչ��V��(EKF)��ں�MTI�Ȃ��Ϣ

ҕ�l��̫�y�ˣ��Y�Ċʶ�ģ�B��㷨��`

�\Մ��ՙC��˵ĝ��Σ�U

��Ի��˙C��

��x��Ҷ��v��ͷ��˙C��C��

��x�Ƽ��£��I��ܙC��˵�ҕ�X��֪�c��

��ՙC��(ӭ�e��v�⡢��\...)

��C��

�C��_�lƽ̨

��Ȼ�Z��̎�����g����g�Mչ���Ĵ����c�aƷ

���ՙC����(ӭ�e���v�⡢���\...)

���������C����

�C�����_�lƽ̨

��Ȼ�Z��̎��g��g�Mչ��Ĵ��c�aƷ

��ՙC��(ӭ�e��v�⡢��\...)

��C��

�C��_�lƽ̨