エストニアにおけるWeb標準
著
Web Standards Groupのメーリングリスト経由で、Web Standards in Estoniaという記事を覚え書き。エストニアにおけるWebページの標準化動向に関する調査結果なんですが、なかなか興味深いです。調査は、2005年2月11日に取得された総計21,905ページを対象として、おもにW3C Markup Validation Serviceを活用、スクリプトにより半自動的に実施された模様。そのスクリプトはPerlとPythonの実行環境があれば動くらしく、同ページ上で公開されています。
結果をかいつまんでご紹介すると、文法的に妥当(valid)だったのは全体のたった2.2%。採用されている文書型としてはHTML 4.01 Transitionalが一位、次いで同4.0 Transitional、XHTML 1.0 Transitionalが3位。実は3位とほぼ同数でHTML 3.2が採用されています。ちなみにこの文書型の順位は全ページを対象としたものであり、validなページに限定してみると、HTML 4.01 Tra.→XHTML 1.0 Tra.→HTML 4.0 Tra.という順位で、ちょっとした逆転がみられます。XHTML 1.0が採用されたページでは、文法妥当性にも配慮されていることが多いといえるのではないでしょうか。table要素を含むページについてみると、validなページでは一切使用していない割合が50%に対してinvalidなページでは26%。ただ一度だけtable要素を含む場合の割合が、どちらの場合でもほぼ同じというのが面白いです。ほかにも、登場する(X)HTML要素の種類に関する統計などもあります。
僕はまだ実際に動かして試してはいないのですけど、各国毎に同様の調査をして比べてみると、結構面白いかもしれません。暇ができたら(できるのか?)、とりあえず日本の状況を概観してみたいと思います。あるいはターゲットを官公庁系ドメインに絞って、嫌がらせ(謎)をしてみるかな。