2022年,一则明星考编的热搜把文字编码玩得出神“入”化。这只是关于文字显示的无数小故事之一,你肯定遭遇过的锟斤拷�⊠等各种乱码,还有人的名字连电脑都打不出来。这一切,都跟计算机显示文字的原理有关。这期视频有点长,因为我们想跟你把这事儿掰扯清楚~
实时更新,欢迎订阅!Real-time updates. Subscribe!▶goo.gl/81zX4o
🎥柴知道热门视频🔥
【为什么你的头会秃成M、C、U型?丨Why is your head bald into M, C, U shape?】 • 为什么你的头会秃成M、C、U型?拿什么拯救你...
【搜索引擎怎么搜不到信息了?| Why can't search engine find information?】 • 搜索引擎怎么搜不到信息了?因为互联网正在孤岛...
【蓝牙怎么这么多毛病还依然长盛不衰?丨Why is Bluetooth still popular with so many problems?】 • 蓝牙怎么这么多毛病?还依然长盛不衰?Why ...
【贵的保温杯是不是智商税?| Is the expensive vacuum flask an IQ tax?】 • 贵的保温杯是不是智商税?不差钱的保温杯长什么...
💡柴知道科普系列▶is.gd/g1ckYP
📘柴知道读书系列▶is.gd/kxgLND
=============
一起在知识的海洋里狗刨吧~Let's play together in the ocean of knowledge~
#柴知道 #ChaiKnows #中文
这一期的时长和工作量,都是1期堪比3期长。而且为了尽量简明,在视频做出来后,我们还忍痛删了2分多钟已经做好的片段......总而言之,希望能通过这样的方式,给大家简明、清晰地讲清楚关于文字显示和乱码的原理。 如果你喜欢本期视频,记得给我们点一下订阅和喜欢,真的做累死啦_(:з」∠)_
删了2分钟?别啊,做个导演剪辑版另外放出来呗
这期很牛逼
這一期真的很厲害
太不容易,幸苦了,又学到了新的知识
我就说怎么割了这么久😋
超级喜欢那一句:“就把乱码当作是计算机发展史为我们所绽放的一朵朵烟花吧”
覺得麻煩了點就.....(笑
大疵花
紅色按鈕的那種嗎?
确实如此,现在有那么多种的文字编码方式在未来不会再有机会见到了
@@laughlife6827 密码是六个0那种
作為資工領域,不得不說真的做的淺顯易懂
那是,重點是剪輯更是到位
不要太自以為是了
这期的科普视频终于解决了我十多年以来的困惑🤣
这期视频做的太棒了!!!我一直很困惑为什么会有这种中文乱码😂 不知道怎么感谢你们,就送你们一首诗吧! 锟斤拷�⊠ 斤拷�⊠锟 拷�⊠锟斤 �⊠锟斤拷 共勉😎吕严中尉!
😂
手持两把锟斤拷 口中疾呼烫烫烫 脚踏千朵屯屯屯 笑看万物锘锘锘
@@user-xe1de9if2o 怎麼解的?
@@dasing2 你应该能直接 google 到解释(这诗是我道听途说来的)。简单来说后几个是 Windows 中文编程时容易出现的东西。
我就知道有这个@@user-xe1de9if2o
目前看過解釋最清楚的動畫,製作一定很辛苦!不過還是有個小錯誤。 Unicode最初對待漢字的確是把不同寫法的字全部整併成一個編碼,但實際應用大有問題,各地漢字書寫差異太多,也有新舊寫法的不同,如果全部都統一編碼會造成不同地區的人閱讀時可能被迫使用非本地的文字外觀,或是沒辦法呈現文字的新舊標準,所以後來編碼就改用Han Unification Rule把不同外觀的相同漢字全部拆開編碼
比較麻煩的是字體上因為同一個編碼,導致會顯示出不正確的寫法 因為重複性高,很多中文字體本身自帶日文,或是日本字體自帶中文 結果編碼共用字體顯示的寫法也不是該國正確寫法了
其實漢字的原理去細分那些寫法的不同是很沒意義的。那些細部的差別其實根本是美術字型不同的程度,連異體字都算不上。
@@g863210xie 舉些簡單的例子 傳統漢字固有寫法已存在差異的像是群羣、裡裏、曹曺、夠够、麵麪、館舘、為爲、線綫、畫畵、並竝 日本新体字和中國簡体字存在差異的例子像是実实、変变、庁厅、図图、辺边 以上這些都是相同文字在各政權的不同書寫標準,要說是異體字也算不上,但讓學A版本的人去適應B版本的書寫標準又覺得隔應,如果只能共用相同字符,那要套哪種標準才能維持中立並忠實記錄傳承?又如何記錄漢文歷史上的各種文獻用字差異?
@@g863210xie錯誤,因為當地人真的不是這樣寫,你在日本當地用台灣寫法是會被當成寫錯的,他們自成的教育體系也都有規定筆畫怎麼寫 只是unicode終究是歐美體系主導的編碼所以對於漢字重視程度沒那麼高(另一方面當然漢字太多也是原因,不過萬國碼總字符本來就超多了我覺得漢字也只是其中一小部分而已
看了这期视频之后,突然觉得公制和英制两套单位也没那么混乱了
习惯问题
@@dodomakudo1783 英制的進位問題確實麻煩 習慣用也不會喜歡
@@user-cp4cj1nu9c 就跟现在的乱序键盘一样……用习惯了没啥感觉……
文字乱码我可以忍,但是为了人类发展,请大家看到用英制单位的人就像往它嘴里灌翔。再把它头打爆。
突然想到當年秦始皇統一了
06:00 說錯了, 電腦中文漢字在當時80年代, 由 IBM 台灣子公司主導和倚天等台灣本土其他公司合作下, 將原本 DOS 加入中文和各種文書處理應用程式. 當時台灣的字碼叫 BIG-5 (CP950), 日本就使用 NEC PC-9801 DOS/V 為主的 JIS 因BIG-5 由台灣商業主導, 很多異體字,舊字,俗字和非常用字都沒有, 最後要由其他海外國家(如香港,星馬泰) 自行追加(海字集)作BIG-5 碼的補充. 因80年代大陸因沒有相關標準, 直至80年代後期,由當時大陸政府, 要求 Microsoft 幫助 使用當時唯一大陸使用的GB2312中文電碼, 所以第一套正式支援的簡體中文系統, 要在 Win3.1 才正式出現. 後因大陸商業使用發現文字量不足夠, 再修改擴充為 GBK, 但因大陸官方規定只能用 GB2312, 導致身份證明文件電子化時, 很多人被自願改姓名.
不明觉厉
不是說錯,是不可以辱華,明講台灣比中國發展的早。
@@b116310 笑死,各種自古以來為起手式的共共無法接受😂
都特別說 "中國台灣"了,一切說到台灣任何優點的 都會被模糊化吧~ 但是謝謝你的補充~讓邏輯更完整~
@@user-ux7sy8ue2k 问题是,台湾后劲不足。。而且,台湾所谓的“正统文字”,也有严重问题。
2天后 回来感谢柴司 因为你们做了这一期视频,使我一个不懂网页代码的人知道如何把我那个下载的本地网站乱码改好。 现在我已经可以正常的浏览那个网站了,非常感谢。再也不会�了。 柴司最棒了,龙图图小姐姐最棒了, 老板最棒了。
大推! 這主題只要有被電腦亂碼搞過的一定都會覺得超有趣的
這期很棒! 加油呀!
这期节目太棒了!!!感谢柴司!!!
这期做的是最好的一期❤
辛苦了 這期真的做得太好了
這集真的太有料 辛苦柴知道的各位了
柴知道太棒了!永遠支持柴知道!
作为科班出身的同学,非常感谢你们做出这期视频,我已经不下N次在工作中要向不同的部门说明文件保存的编码问题以及在页面写上一堆跟业务毫无关系的编码提示,仍然避免不了有些同事的【编码病】。甚至于打算跑路考公,试题里面居然还会在不提供具体编码集的情况下问我一个中文字符占几个字节,问我是1个,2个,还是4个,6个。我很想大骂一句把8个的选项或者直接来个E钝角的选项塞出题人嘴里。然而这种误解根深蒂固,当我向多年的好友吐槽这种情况的时候,好友说【肯定是占2个啊】。😊😊😊😊😊😊😊😊现在他坟头草两丈高了
这集很棒!干货不少
这期视频真的是干货啊太赞了
柴知道这期做得很详细,棒!
這集真的很足料😎😎😎😎讚啦
這麼優秀的影片,製作團隊實在是太厲害了 講解幽默,原理簡單易懂 動畫也毫不馬虎 五體投地尚不足一表我的敬佩之意
五体?你的其他物件呢?
这期的质量好高,我看得非常认真。
柴司最高 超愛你們的影片 超優質❤
非常好的視頻,感謝團隊的努力。 能否再出一集關於使用者平時輸入時需要注意的地方,及遇到亂碼時如何應對呢。
終於解開20多年來的"外星文"之謎_很用心製作的一集_加油鼓勵_讚!!
质量太高了,赞赞赞
谢谢,这的确让我们更加明白了字符集编码,作为业余编程爱好者,算是第一次这么系统的知道字符集编码!
中国台湾在哪里我地图找不到这个区域
计算机专业人士给你点赞啦😜
柴柴辛苦了。解决了我多年的疑问
辛苦辛苦~真的做的很棒!!!
清晰易懂,太感謝了。
写过c 的人都会遇到过著名的”烫烫烫…”,据说有人看到这个乱码惊慌的拔掉了计算机电源🔌 😂
用c處理字串真的是惡夢
烫烫烫烫。。。屯屯屯屯。。。
道理上没错,毕竟0xCC和0xCD在x86里的定义差不多都是终止当前程序的意思,所以CPU遇到这些就直接让程序闪退了,可不是烫烫烫嘛(强行解释
錕斤拷錕斤拷錕斤拷
手握两个锟斤拷,口中直呼烫烫烫(
这集做得太好了,点完赞再发个赞👍
整部影片的圖示動畫真的超專業,有夠厲害
做得太用心啦
8:34 中國台灣 管不到的中國台灣 哈哈
人家說不定也是迫於無奈這樣講😂
人家主要戰區在大陸的網站 講台灣會被說台獨 講中國台灣就是愛國 中國麻 不意外
人家也要生存
做得很好,虽然很多专业术语听不懂 但看得出来找了很多资料 有用心
解释的简直太清晰了!感谢
"這題我會" 好可愛😂
我想到一个好办法,我们可以用一个小棍,蘸上黑水,在一个白色的平面物体上把这些文字画出来,这样不管拿给谁看都不会出现乱码了。
這樣不就點陣化了嗎?不如用白紙。
@@oishibaking 我想白色的平面物體應該就是白紙。
🤣png
图画也是編码吧?还是说不是?
那怎么做字体,每有一种字体就画一张画吗?怎么定义这个画的分辨率?怎么方便信息交换?编码编码就是为了方便电脑处理减少存储带宽成本才出现的东西
真的很用心,加油
超级棒!加油!
繁體這邊對GB碼比較不熟悉 我們都是用大五碼BIG-5 所以那個錕斤拷 今天我也是第一次見
回復“文字編碼”即可獲得錕斤拷一份
烫烫烫!!!!!!
口口口口
美味锟斤拷?
辛苦惹!很有趣的知识
这期太有意思了,辛苦辛苦
繁體古早bif5大五碼,微軟擴充叫CP950,也不是UTF8解。寫python 踩過坑。另外,英文還有一個UTF7的也很坑,跟預設的UTF8差一丟丟,幾乎正常解但就是幾個拉丁美洲字母會出亂碼。 以上都血淚史。
做得非常好,很淺顯易懂! 我之前有段時間做mod就想了解這個UTF-8是個啥,後來花了很多時間勉強懂了個皮毛,看完影片後總算有了個大概的了解! 非常感謝!
片子很精良,很棒
很喜欢这篇的内容,可以说是干货等级了
我以前在印刷店工作也會遇到,因為附近很多學校,然後就出現一些學生沒轉檔導致版面跑了,甚至亂碼的情況,也有明明螢幕看沒問題,但印出來變亂馬的
我們需要秦始皇XD
補充一點,台港澳地區在用的繁體字編碼叫BIG-5,大陸網站載來的軟件就常常無法正常顯示 作為一個碼農,每每要編譯C語言程式時,還得換編碼真挺麻煩,偏偏微軟就選BIG-5編繁體中文 哎呀python真香
BIG5是不是看起来像韩文一样,字之间插空格一样?
@@mmorpg9564 用BIG-5看UTF-8的時候會出現很多生辟字或框框,其他我就不清楚了
可是python對於文件的編輯和儲存會使用ANSI也就是系統預設..... 明明他自己的程式碼.py只允許utf-8 然後就導致github上面有些python寫的軟體,存取設定檔會有亂碼問題, 非常優秀
第一次看你們的影片,看一半就讓我訂閱了。感謝分享。
辛苦了!很精彩的一集
手持两把锟斤拷,口中疾呼烫烫烫。脚踏千朵屯屯屯,笑看万物锘锘锘。
很棒 鲲斤铐
太棒了,辛苦了!!
辛苦了,但是一期视频就把复杂的事情讲的清楚明白了👍🏻
@柴知道ChaiKnows Official Channel 谢谢柴知道,首先非常肯定这个视频,其次希望制作一个关于字符相关的视频连载视频。 1. 讲明白了,字符,字符集,字符编码,码位,之间的有关系。 2. 如何解决乱码的问题。(Windows/Linux操作系统各一期)
原來是這樣啊!學到了,這邊能不能看到最後片尾所説的文本啊?也想知道那些因爲篇幅沒有放進去的小知識
非常棒! 支持創意視頻
非常棒!谢谢柴知道
UTF 8 共有 10FFFF 個 Code Point,可由1~4個 Byte 組成,而且任何一個 Byte 都能夠得到到底是頭還是尾.但 GB18030-2000 的字庫超出了 10FFFF。
送一大堆錕斤拷來告白笑死
这个视频做的太好了 三连鼓励
因為演算法知道這個影片 因為這個影片訂閱了這個頻道🤣 很喜歡這個影片,內容非常有趣 謝謝柴~
感谢~
第一!昨天在微博看了视频,今天再看一次。(❤ ω ❤) 柴柴
這個影片完美,除了中國台灣這個字有一點….
柯粉很喜歡聽到祖國人喊中國台灣
真不错真不错!专业而且易懂!
最喜欢的KZhead频道,没有之一❤弱弱的问一句,没有考虑做个英文版吗?
以前还有一个屁股坐歪的做的也挺好呢.不要总是用最.
我喜歡1
我也用winamp 不過是用最終版的
终于知道昆斤拷是怎么来的
目前看到最清楚的解釋動畫,讚讚
浅显易懂,辛苦了~
有个软件能大概率帮你转换字符集,Locale Emulator
小时候在盗版横行的网络蛮荒年代,南极星属于是电脑必装软件之一了
謝謝你!讓我多少了解亂碼的問題 !
这期讲的很清晰
扩充字符那档事还没结束呢,目前电脑已经可以支持9万个汉字,可是必须安装扩充机码和字体。这还没完呢,另外有团体宣称汉字有14万个😂 另一件事情,2019年坐飞机去缅甸,才知道他们的视窗刚刚支持缅文,真可怜。那时候的网页翻译的缅文老是出错,现在好很多了
还记得小时候买盗版游戏碟 出来的就都是锟斤铐😂 好像还有各种注音符号。。。
感谢这视频作者🙏🏻🙏🏻🙏🏻 我终于明白了什么是电脑语言😂🎉🎉🎉
辛苦了🎉
一個科普節目都要扯政治 還是別科普了吧
终于知道我为啥改名了。。。
很用心,赞👍
超級優秀的一集
这期后期工作量有多大,做过后期的细思极恐!
很有意思!
这期好好看啊
课补好了,谢谢
錕斤拷很好笑XD 當時編碼問題最有感的可能是 你去下載人家使用RPG製作大師製作的遊戲 或者是某些其他冷門遊戲時候 文字不會正確辨識導致打開來從遊戲視窗到內容文本都是一大堆空白鍵跟方框 當時在資源點分享處通常這類遊戲旁邊都還會告訴你去下載一個編碼轉換器去開遊戲 這轉換器安裝完後執行就會有一個視窗提示你先指定遊戲啟動的本體程式exe 然後再選擇適合的語系編碼 確定後這程式也會替你建立一個捷徑在旁邊 這捷徑幫你跳過前面啟動轉換器~選擇的所有過程 接下來就會看到一個顯示正常文字的遊戲了(前提是選對編碼 那個轉換器就是讓當時的電腦不需要去系統控制台切換語言重開玩其他國家遊戲的最好辦法 而且這東西能適配各種程式上 例如影片提到的word錕斤拷 在還沒被後面步驟覆蓋編碼訊息前 用轉換器讀原檔選對了也能顯示出來原內容 我記得我有一段時間 還下載過另一支類似的編碼轉換工具 不過這個編碼轉換工具手動啟動後會縮小在系統列內 當瀏覽網頁 或者開啟文字的文件檔遇到錕斤拷 就可以在系統列把工具叫出來 然後叫他進行翻譯 文件檔甚至可以叫他輸出一份編碼轉換完成的新文件 這段時期則是我喜歡去爬簡體小說網站的時期
locate em...忘了 印象深刻的是果沒用的話,繁中的確定會變成 耗
锟斤拷....這是我討厭用WINDOWS 的原因....
太牛逼了这期视频
超優質影片欸 有料
UTF-8其实也不适合作为通篇汉子的编码方式,因为一个汉字基本上都是占用3个字节
其实也就是 1MB 能存的汉字从50万个变成了33万个而已,再加上现在的电脑早就不是在 MB 级别的存储单位上死抠的水平了……
以前用C++编程的时候经常出现屯屯屯屯 烫烫烫烫也很有意思哦 😅 要不要扩充讲一下
還有口口口
满分视频!
製作用心, 簡單易明, 謝謝