數智時代,我們需要什么樣的語言規范?

“徐冰:引力劇場”展覽海報
認識數智時代語言傳播特征
語言規范問題長期成為公眾關注熱點,不是因為一直沒有解決好,而是因為不同的時代都會面對新的問題。中華人民共和國成立初期面對的是方言分歧和共同語問題,改革開放初期面對的是新技術革命和自然語言處理問題,世紀之交面對的是外來概念和外語教學的沖擊等問題。最近十幾年來,互聯網文化給傳統的規范語言面貌帶來了不小的改變,網絡語言熱議未退之際,數智時代的種種語言問題又接連涌現。一時間,網絡語言問題、AI語言問題,以及新舊字音、詞典釋義等傳統語言規范問題交織在一起,公眾對語言問題的關注熱度呈現出多點共生、交錯起伏的局面。
這種形勢下,值得思考的是:漢語母語者既是語言的使用者也是語言規范的維護者,如何化解語言創造力和規范性訴求之間的沖突?語言作為特殊的文化載體,既是學術研究的對象又是日常生活之必需,它的健康發展主要是語言工作者的責任還是語言使用者的義務?歷史上漢語漢字隨著民族的交融和書寫媒介的改變發生過那么多次重大的變化,為什么人們對數智時代的語言問題產生如此大的擔憂?
其實這種憂慮未必來自語言本身,更多的是文化形態的劇變在語言問題上的投射。互聯網極大改變了千百年來的文化接受習慣,它使得原有遠近疾徐之別的文化信息無差別地大量投放,也深刻改變了人們的語言接受習慣。一時間,家鄉話和外鄉話、日常話和標準語、民間話和官方話、俚俗語和文藝腔……各種傳統意義上的兩極對立都漸被打破。對語言規范化,似乎每個人心中都有一份自己的訴求,但每個人期待和把持的規范標準又很不相同,甚至是彼此對立的。
因此,如何看待數智時代的語言規范問題,需要從這一時代的傳播特征去認識。
熱議不斷的網絡流行語
先從網絡流行語說起。古往今來每一個時代都有流行語,為什么唯獨“網絡流行語”得到了格外的熱議?細究起來,“網言網語”還真跟歷史上的流行語有著明顯的不同。
人類進入互聯網時代以前,很少有跨地域、跨領域、跨階層的流行語,那時的流行語基本屬于行業語或者方言土語。互聯網打通了地方和領域之間的天然區隔,各種行業化、區域化乃至個人化的用語齊刷刷地展現在所有人面前,誰都是一種“撲面而來”的被動感,于是感到不適應、不接受的受眾數量就前所未有地多。熱衷于使用流行語的人群,跟反感、拒絕流行語的大眾形成了天然的對立,網絡流行語難以避免成為多數人視為另類的東西。
在這樣的情形下,對網絡流行語的自然篩選機制也就應運而生了。那些超越階層、喚起更廣泛時代共鳴的新說法,在互聯互通網絡環境中得以傳播,成為時代語匯中鮮活躍動的因素;與此同時,那些小眾化而有悖認知常情的新奇說法也層出不窮,始終活躍在特定群體中,持續干擾著大眾的視線。這是互聯網時代呈現出的與以往不同的新景觀,“優勝”與“劣汰”都沒有成為最主流的事實,觀念與態度的沖突從未休止。
應該說,很多網絡流行語以其形式的靈動、構想的新奇、觸角的銳利和思維的深刻顯示出獨有的魅力,成為最前沿最有引領力的語言成分,也將在漢語語匯發展史上留下我們這個時代語言創造力的記錄。據報道,剛剛問世的《現代漢語大詞典》就收錄了數十條新世紀的網絡流行語。但毋庸諱言,網絡上許多新興的表達方式,或莊諧失當,或構形怪異,或趣味低俗,或裹挾惡意,不僅破壞了和諧健康的語言環境,更給“講信修睦、親仁善鄰”的文化傳統和社會氛圍造成了嚴重的污染和損毀。
造成這種亂象的原因,首先是網絡化傳播方式,一改以往那種流水般的自然流布,代之以沖擊力極強的“閃送”到位,對一般公眾的接受能力是個很大的挑戰。再者,過去的流行語不管是來自文人的創造還是公眾的口頭塑造,大都經過了一段時間的社會化的認同,也就是說,得到了較為廣泛層次的公眾認同。而網絡流行語與此前的流行語不同的一個重要特點是,相當一批網絡流行語起源于社會閱歷并不豐富的青少年,尤其是生發于網絡游戲和動漫等外來文化中,這些“熱詞熱語”缺少社會生活的基礎,因此就普遍帶有一種與公眾成熟意識之間的對抗性。這是不同于以往的新的特點,也是風險所在。如果說網絡時代語言規范化有什么新特點的話,這種流行語的起源和傳播方式是格外值得注意的。
這種特點帶來的后果,一是語言習慣的沖突不可避免,二是錯誤意識的感染和蔓延。
語言規范需前置前移
傳統的語言規范行動,倚仗權威媒體的統治性,噪音雜音壓不過正統的聲音,錯誤說法基本沒有市場。自媒體時代,語言文字好像誰都可以平起平坐地發表看法,不管有沒有基本的系統觀點和歷史文化常識,誰都可以針對一字一音提出理直氣壯的質疑。這就提醒語言文字管理部門,不能再躺在舊有模式中循規蹈矩,不能總是讓規范措施出現在把守的最后一關,而應主動前置前移,像中醫倡導的“治未病”一樣,把規范的閘口設置在最初的教育環節上。
既然規范化的語言文字是人們的共同追求,那么,合理的規范行為就應該先置于社會語言生活的前端。現代漢語已經有逾百年的歷史,哪里有坑,哪里有雷,語言文字工作者心中有數。如果不善于利用現代媒介尤其是新媒體平臺,以春風化雨的方式讓公眾接受規范的語言文字知識,錯誤和混亂一經形成,應對將是一件很難的事情。十年前連續舉辦了三年的《中國漢字聽寫大會》,對于社會各階層人士熟習字形、規范寫法、校準字音、了解字義,都有好處。像“冒”字的上頭為什么那么寫,“肺”的右半邊跟“市”有什么不同,“蹚水”為什么不要寫成“趟水”,“寒暄”為何不能寫作“寒喧”,向公眾進行了普及,同時還傳播了“葳蕤”“翊贊”等好詞。
地名的字音,在普通話里是應該按規范字音讀,還是模仿方音的讀法擇選普通話里另外的字音讀呢?地名“六安”要不要讀如“路安”?“解州”要不要讀如“亥州”?讀古詩詞遇到不押韻的情況,是否都需要用傳說中的“葉音”方法,臨時改個字音,以求諧和呢?這些問題,本來都有并不深奧的系統性學理擺在那兒,專家不出來講,普通人不愿去查,任由奇談怪論隨處登場。這樣造成的后果,不僅是知識被誤解淹沒,更重要的是,語言文字工作者放棄了一種應有的責任——培養公眾問計于學理的習慣。移動互聯時代沒有沉默,沒有空白,規范的缺位必然就是失范的蔓延。
語言規范不可固化語言創造
我們的文化生活被網絡全覆蓋已經有四分之一個世紀之久,卻仍有不少人的思維停留在20世紀里,或者看見也不愿相信人正被技術牽著走。網絡不僅改變了信息傳遞的速度,延伸和拓展了傳播的渠道,也用它的方式和理念改變著我們的文化本身,悄然改變著我們的語言規范。
約10萬年前,人類產生了語言,這是人類社會交際性的第一次飛躍;約5000年前,產生了文字,這是語言符號化的重大突破,實現了信息的跨時空保存;隨著文學的發展、文教的昌盛,產生了文體成熟的書面語,這是規范化的語言表達形式,尤其是印刷術的推廣,推動了文化傳承與知識積累;到20世紀,媒體語言發展起來,人類語言進入了大眾傳播時代,相對于傳統的文學性語言形式,它有更加標準化、高效傳播信息的特點;20世紀末,網絡語言興起,這是數字時代的新興表達,以簡潔、創新、多模態融合為特色;2022年12月起,人類文化史上的全新事物——人工智能語言全面登場了,這是第一次非人類主體的語言生成,代表了技術與語言的深度融合。以生成式大語言模型(Large Language Models, LLMs)為代表的人工智能技術迅速發展,人類進入人工智能時代。
不少人文學者對此表達了憂慮,大語言模型會不會顛覆文學人數千年來一手創造的美文?會不會扼殺語言的創造力,泯滅語言的鮮活的靈魂?近兩年,不少類似于“警惕人工智能對文學語言的侵蝕與固化”的話題不斷見諸報端,有人說“作為文藝之基石的語言本身已經受到人工智能的侵襲,呈現出固化的傾向”,“人工智能不僅侵襲了文學語言,更產生了固化敘事語言的傾向,逐漸形成了具有某種程度的一致性的語言陳述狀態”。這代表了大家對人工智能語言無序發展的擔憂。從我們近兩年來對人工智能語料的觀察和梳理看,這也確實是已經發生的事實。如果對此不給予充分的重視,不及早行動起來,用學術的思維和技術的手段積極干預,我們的語言文化也許就會在我們這一代人的眼前悄然改變了面貌。
這難道只是一些憂天杞人的責任意識?或許是吧。我們看到更多的現實是:詞典式和百科全書式的電子工具早已棄置一邊,無人不在津津有味地與人工智能交流,人們更喜愛那幾個會說人話的人工智能寶貝。由人工智能生成的長篇短篇,由于文從字順,邏輯清晰,尺度合理,讓使用者毫不挑剔它的語言。一時間,“語言規范”問題在人工智能生成文本到來之后似乎小了許多。更有人樂觀地以為人工智能可以幫助我們推敲字句、校正文法,給我們勻出精力去經營文章的其他方面。殊不知當你越是對它陷入依賴,漢語的發展方向也許就已經失控。
語言文字不僅是文化的載體,更是文化本身。語言文化的價值不僅在于其規范,更在于它的精彩。千百年來,中國語言文化在不同的時代煥發出風格各異的光彩,都是先人智慧的創造。毋寧說,多姿多彩的華章一定程度上正是流播不暢的非網絡時代的產物。每個作家發展著自己的積習,每種文體塑造著自己的風格,每個群體經營著自己的慣例。語言正是在不同的文體中實現著創造力,而文體正是人工智能的敵人。很多人說人工智能不能創造語言,那是因為它沒有精準把握文體風格的能力。
語言畢竟是人的創造,語言的命運終究應該把握在人的手里。語言學家蘭納克說過:“人們能夠容忍(并且常常預期)相當多的非規約性,這是語言使用的正常特征。”可見,試錯和容錯,是語言的生存和發展之道,如果人工智能把我們的語言工具帶到了一個“無錯”的境地,我們該感到慶幸還是悲哀呢?
語言規范,是一個說起來讓人情緒復雜的概念。數智時代,老的語言規范問題有了新的變體,新的失范問題又層出不窮,而人工智能對人類語言帶來的顛覆性的牽制,又給我們提出了更多全新的課題。不論如何,一份中華語言文化的責任感,都不允許我們順水推舟。
(作者系中國社會科學院大學文學院教授)


