計算機信息技術

編碼“統一”:字符編碼標準

每一個互聯網用戶在試圖建立一個或另一個其功能的至少一次寫在屏幕上看到的 拉丁字母 詞“統一”。 這是什麼,你會通過閱讀這篇文章了解。

定義

編碼“統一” - 字符編碼標準。 有人建議由公司統一非營利性組織 在1991年。 該標準旨在匯集不同類型的字符的最大可能數的文件內。 頁面,這是基礎上建立其可以包含來自不同語言(俄語韓國)和數學符號字母和字符。 在這種情況下,所有的字符集字符的顯示沒有任何問題。

為創作的原因

很久以前,長的單個系統出現之前基於所述文檔的作者的喜好被選擇“的Unicode”編碼。 出於這個原因,經常閱讀文檔時,有必要使用不同的表。 有時需要做幾次,這大大複雜化了普通用戶的生活。 前面已經提到,要解決這個問題,1991年應邀為Unicode公司一個非盈利組織提供了一個新的類型的字符編碼。 它被設計為過時和各種標準結合起來。 “統一” - 的編碼與ozvolila達到不可想像的時候:創建一個支持的字符數量龐大的工具。 結果超出了許多的期待 - 有同時包含英文和俄文,拉丁文和數學表達式的文檔。

但是,需要先統一編碼的創建來解決一些已經出現的問題,由於種類繁多的現有當時的標準。 其中最常見的:

  • 精靈寫作,或“胡言亂語”;
  • 字符集的限制;
  • 問題變換值編碼;
  • 字體重複。

小歷史附記

試想一下,院子裡80。 電腦硬件不是很常見,也有今天不同的形式。 雖然每個OS是獨特的,高雅每一位發燒友的特定需求。 極品的信息交換被轉換成額外的返工一切。 試圖讀取其他操作系統中創建的文檔,經常會顯示一個奇怪的字符集,遊戲與編碼開始。 它並不總是這樣做很快,有時是必要的文件無法在六個月內打開,甚至以後。 人們誰經常交換信息,為自己創造一個轉換表。 然後對他們的工作揭示了一個有趣的細節:“你從我的”來回需要在兩個方向上創建它們。 讓平凡的反相運算器不能,因為它在源的右列,左 - 結果,而不是相反。 如果您認為需要在文檔中使用任何特殊字符,它們必須首先添加,接著又,並向他需要做的,這些字符不會成為一個什麼樣的合作夥伴解釋“胡言亂語”。 而且我們不要忘記,每個編碼必須制定或實施自己的字體,這導致建立在操作系統副本的數量巨大。

試想一下,再在頁面上的字體,你會看到10個相同的Times New Roman字體與小記:為UTF-8,UTF-16,ANSI,UCS-2。 現在,你明白的通用標準的制定勢在必行?

“創作者的開國元勳”

於1987年被發現創造的Unicode的起源時Dzho貝克從施樂公司,與李柯林斯和來自蘋果馬克·戴維斯一起在通用字符集的實際創作領域開始了研究。 1988年8月,Dzho貝克出版了創建16位的多語種國際編碼系統的建議草案。

幾個月後的Unicode工作組已擴大到包括肯·惠斯勒和Mike Kernegana從RLG,Sun和其他一些專家格倫Rayt,實現一個共同的編碼標準初步形成工作的完成。

一般說明

Unicode的基於符號的概念。 根據這一定義是指存在於書面形式的一種特定形式,實現通過一字形(它們的“肖像”)的抽象現象。 每個字符在屬於特定單元標準“的Unicode”唯一的代碼給出。 例如,字形B也以英文和俄文字母,但它相當於為Unicode 2個不同的字符。 他們都受到轉化為 小寫, 噸。E.,每一個描述密鑰數據庫,一組屬性和全名。

統一的好處

從編碼“UNICODE”等同時代有跡象“加密”字符的巨大庫存。 他的前任有8位的事實,即由28個字符的支持,但新的設計已經是216個字符,這是向前邁出了一大步。 這使編碼幾乎所有現有的和常見的字母。

隨著“統一”的出現不再需要使用轉換表:作為一個單一的標準,它只是否定了他們的需要。 同樣,他們已經陷入遺忘,而“胡言亂語” - 一個單一的標準使他們不可能,也排除需要創建重複的字體。

統一的發展

當然,進步不到位,自第一個演示文稿已經過去了25年。 然而,字符集“Unicode的”頑固地保持其在世界上的地位。 在許多方面,這已經成為可能由於這樣的事實,它已成為容易實現,並已蔓延,被認可的專利(付費)和開源軟件開發者。

我們不應該,今天我們看到了相同的代碼“統一”作為一個世紀前的四分之一相信。 目前,它是由版本5.h.h取代,和編碼的符號的數目已增加至231.使用更大的餘量標記拒絕仍保持為Unicode的16支撐的可能性(編碼,其中它們的數量有限216的最大量)。 公司自成立以來,並達到2.0.0版的“Unicode標準”增加了,它幾乎2倍包含的字符數。 機會和在未來幾年持續增長。 對於4.0.0版本已經有必要增加標準本身,並已完成。 其結果是,“統一”發現在我們今天所知道的形式。

還有什麼是Unicode的?

除了龐大的,不斷有字符數更新, “統一” -編碼文本信息是另一個有用的特徵。 這就是所謂的正常化。 而不是通過整個文檔逐個字符滾動,並替換對應表的圖標,使用現有的正常化算法之一。 這是什麼?

而不是浪費在相同的字符,這可能是在不同的字母類似的定期檢查計算機的資源,使用一種特殊的算法。 它可以讓你做一個類似的符號單獨列的查找表,並且已經重新申請他們,而不是遍地重新檢查所有數據。

這種算法的開發和執行了4。 每次轉換嚴格明確的原則,從不同的發生,所以要叫他們中的任何一個都不是最有效的可能。 每個設計的特定需求,在嵌入式和成功應用。

傳播標準

在25年的歷史編碼“UNICODE”我可能已經獲得了最廣泛的世界。 根據本標準調整程序和網頁。 應用的廣泛性可能表明的Unicode現在用互聯網資源的60%以上。

現在,你知道,當“統一”的標準出現。 它是什麼,你也知道並且能夠理解本發明的全部意義,由一組專家的Unicode公司的發 超過25年前。

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 zhtw.birmiss.com. Theme powered by WordPress.