找回密碼
 立即注冊

QQ登錄

只需一步,快速開始

搜索
查看: 4722|回復(fù): 0
收起左側(cè)

文言文其實是一個很牛逼的壓縮算法

[復(fù)制鏈接]
ID:3721 發(fā)表于 2016-6-13 00:15 | 顯示全部樓層 |閱讀模式


     之乎者也,焉哉乎也
     文言文,咋一看,何其難兮,若無師者傳道授業(yè)解惑,教其句讀,真不能解其意。、
     而如今我們看文言文很多是有注釋的。

     然而,在我們學(xué)校文言文的同時,如果從另一個角度來看,文言文還真的是一個很牛逼的壓縮算法,是我們爾等編程人員,技術(shù)人員所望塵莫及的技術(shù)。

     既然扯到壓縮,那就要說為什么要壓縮。
     壓縮,很多人都用過,也不用多說,什么rar,zip等。
     既文字被發(fā)明以來,如果知識只是靠口述代代相傳,那人類的進(jìn)步就太慢了。更何況口傳也有口誤,人記憶也是有限,因此也才有很多技術(shù)是在代代相傳中失傳了。
     于是人們想到了用文字來記。
     而象形文筆,一開始只是用來做一些記號,標(biāo)記,并未作通信,交流用的。

     而在更早,比如老張和隔壁老王一起去打獵,由于當(dāng)時還沒有阿拉伯?dāng)?shù)字也沒有羅馬數(shù)字,更沒有什么一二三了,于是只好用用擺石頭來統(tǒng)計誰打的獵物多, 大家把獵物放一塊,根據(jù)自己的石頭來記錄誰打下了多少獵物。萬一隔壁老王使詐,自己多放了一塊石頭,那是誰對誰錯也不知道。
     就像一個普通沒有帶校驗的文件,如果一個字節(jié)錯誤了,一般也不會知道的。

    那么問題來了,當(dāng)老王打獵的技術(shù)越來越厲害,隔壁的三姑六婆也想請教學(xué)習(xí)學(xué)習(xí),想讓后代的人也可以向隔壁老王一樣優(yōu)秀。
那么老王就想這些技術(shù)寫下來。 然而那時候還沒有文字,隔壁老王只能自己和大家說自己的技術(shù),有些領(lǐng)悟能力好的,也能學(xué)習(xí)到一些技術(shù),但這樣口述,老王也教不了多少人。

    于是老王等啊等啊, 等了幾百年后,終于開始有文字了。終于迎來了甲骨文,老王打獵抓了幾只烏龜,在龜背上刻畫了一些關(guān)鍵圖形,這就是原始的壓縮編碼,但是這時候也只有老王看得懂,那怎么辦,所以,他需要教別人。所以,老王只是教會了幾個人,別人就可以拿著那龜背,再向另人教學(xué)了。這樣一傳十,十傳百,老王就出名了。可是,隔壁鎮(zhèn)的人聽說了老王會打獵,大家都想學(xué)習(xí),可是,不能讓老王一個人去對每一個說吧。而且,龜背那么重,怎么運(yùn)輸呀。唉,看來老王有心無力了。

   于是老王等著等呀, 這時候開始有竹簡來記錄文字了,而且這時候的文字也多了很多。不再是簡單的甲骨條文。
這時候,周朝統(tǒng)一天下,禮節(jié)開始盛行,文明早已開始,不再是以前的打獵生活時代。老王也開始化身知識分子。

  一天老王去河邊釣魚,看見有漂亮的姑娘,然而現(xiàn)在已經(jīng)是文明社會,不再是以前原始部落。要是在以前的原始部落,老王就直接一棍打暈了,把姑娘拖進(jìn)山洞即可。(此故事可參照電影《石器時代》(美國電影))。這時候老王也是文人了,既然文人就要有文人的作風(fēng),那就寫情詩吧。于是就到旁邊,簡單弄了竹簡,寫些什么呢,左想右想,那就寫關(guān)關(guān)鳴叫的水鳥,棲居在河中沙洲,善良美麗的姑娘,好男兒的好配偶……(此處暫時省略翻譯版的幾十字),老王一起,尼瑪,不對,這竹簡太小,寫不下那么多字呀,可是,怎么辦呢,又不能只想說姑娘呀,你很漂亮,我想追求呀,總得需要寫些情景烘托一下,才能顯示我佳人才子的優(yōu)勢呀。于是,就寫了這樣“關(guān)關(guān)雎鳩,在河之洲,窈窕淑女,君子好逑”,嗯,不錯不錯,字句工整,朗朗上口,后人一定能很好流傳。于是一篇關(guān)關(guān)雎鳩開啟了情書屆的潮流。
   人家姑娘莫名收到一竹子,我去,這是什么呀,我一姑娘家,大家不識一個,而且不是說女子無才便是德嘛,我這么賢德之人,這什么玩意,沒有寶馬數(shù)匹,豪宅數(shù)間,給我滾粗。
    然后孔子卻不是這看,關(guān)關(guān)雎鳩這么肺腑之表白,如果我是個姑娘,我一定會感動的接受,為他生孩子。感動呀,人家都不知道你寫的是什么呀。

  壓縮算法也不是隨便用的,一個會壓縮,也要另一個支持解壓才對呀。
  于是孔子引領(lǐng)了解壓潮流,儒家思想要盛行,就要傳播?墒钱(dāng)時只有竹簡,儒家思想只是一兩片竹簡可以描述的,用罄竹難書都不為過(這個成語是貶義詞,用在這里不合適,這是錯誤用法)。

這就是開始了文言文和壓縮和解壓的一個盛世,也就是百家爭鳴的時代了。什么儒家,道家,墨家,法家呀,就好比什么Defalte,BZip,
  LZMA壓縮算法呀。
這只是個大概,當(dāng)年孔子傳播儒學(xué),那些弟子都是把一車一車竹簡拉著,要不是有一些弟子稍微有錢一些,要不孔子拖著這些竹簡也不好傳播呀。

  就像壓縮算法,或者說通信記錄吧,為了保證可靠的通信,如果萬一在壓縮過程或傳輸過程,有幾個位錯誤了怎么辦,有可能有幾個位錯誤了,表達(dá)的意思就不一樣了。比如你向姑娘表白, 人家姑娘只是委婉地拒絕你,但是你看錯了,以為是姑娘在給你機(jī)會,你還厚著臉皮不放手。
  那就要有好的算法有糾錯了。
  那么,一個偉大的詞語就出現(xiàn)了, 那就是通假字。

   不就是錯了個字嘛,有什么大不了,老子知道他錯了,不影響了繼續(xù)理解就好。所以,只有在一定的誤碼率下,就能很原來的意思還原回來。就像BCH8校驗,能支持到8個位錯誤了,還可以糾錯呢。但是一旦錯誤太多了,那就沒辦法了。比如我向妹子表白說,我喜歡你?墒牵f,今晚月亮很圓。這是什么跟什么呀。錯誤地這么離譜,我怎么知道她是同意還是不同意了。我怎么知道是完蛋了還是團(tuán)圓地意思呀。就好比你在windows下用rar壓縮了,在linux下你tar怎么解壓出來呀。

   文言文牛逼的之方,還在于它的容錯性。要知道,古代的文言文是沒有句讀的,也就是沒有標(biāo)點符號的,我們現(xiàn)在看到的文言文很多是經(jīng)過別人處理過了,至少也是加了標(biāo)點符號的?墒,我怎么知道原來的意思就是你給我標(biāo)注的呀。就好比有時候看歷史,看正史不一定就是正確的,有時候野史才更真實。

   文言文這么深奧的東西,此是三言兩語就能言論的。只是如果從編程的思想來看,古人已經(jīng)有很多無法超越的經(jīng)典,我們只是學(xué)習(xí)就好。(夜已深,改天再言論幾番)


回復(fù)

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

小黑屋|51黑電子論壇 |51黑電子論壇6群 QQ 管理員QQ:125739409;技術(shù)交流QQ群281945664

Powered by 單片機(jī)教程網(wǎng)

快速回復(fù) 返回頂部 返回列表