Member-only story
「網頁HTML肥大症」的現況、藥方、以及無奈/Frederic Filloux
在網站上只有一頁的文章,往往需要6到55頁的HTML程式碼來呈現。現在,網頁上的程式碼過度肥大的問題越來越嚴重,必須靠更進一步的創新來解決。
當我們閱讀一頁800個字、甚至不到一個網頁的新聞時(編按:原文字數指英文,以下同;但比例上而言即使是中文也應該相去不遠),瀏覽器可能需要載入長達55頁、等於大約50萬個字元的HTML程式碼。
更精準一點說,筆者所分析的一篇757字的網頁(包含4667個字元與空白符號),一共需要多達485,527的字元的程式碼:
換句話說,對人的閱讀「有用」的文字內容,只佔全部資料傳輸量的0.96%;其餘的部份包括超過600個連結、以及超過120組包括追蹤、廣告、分析等等用途的程式碼。例如筆者在另一篇文章中所寫的,光是Chartbeat追蹤分析碼,就長達29,000個字元!
在某些網頁上,實際可讀內容只佔程式碼的不到1%。
如果能知道「程式碼用量」跟「媒體網站營收」的比例關係就好了。以這個例子中的英國網站《The Guardian》來說,結果想必會相當有趣(抱歉,這是黑色幽默;最近這家媒體的生意不太好,不過筆者個人是很喜歡的)。
以《The Guardian》的案例而言,HTML碼的肥大程度確實是有點誇張;不過幸好在正常連線速度之下,它的網頁載入速度還是蠻快的。而且,他們也是首先廣泛運用Google AMP(加速行動網頁)格式的媒體之一;在這個格式之下,會有高達80%的原始網頁碼被去除掉,讓內容在行動設備上的載入速度更快。
作為另一個極端的例子,筆者用HTML發明者Tim Berners-Lee所寫的《World Wide Web…