私は、とあるウェブサービス運営会社の開発部でエンジニアとして働いている。 私の会社では様々なサービスを自社で開発および運営している。私の会社の開発部では、システムのレイヤーごとに部署が分かれていて、 サーバーやネットワークなどの ...
今回は、 文字コードに関連するセキュリティの話題では古参ともいえるUTF-8の冗長なエンコードというテーマについて紹介します。 UTF-8とは UTF-8は、 各文字を1~4バイトの可変長で表現するUnicodeの符号化方式のひとつです。 U+0000からU+007Fの範囲の文字を ...
HTML Living Standardには、文字エンコーディング宣言について以下の定義がある。 Regardless of whether a character encoding declaration is present or not, the actual character encoding used to encode the document must be UTF-8.
世界中に存在するウェブサイトのうち、文字コード「UTF-8」のページが占める割合が、全体の90%を超えたことが明らかになった。 これはオーストラリアのコンサルティング企業Q-Successが発表したもので、それによるとウェブサイトにおけるUTF-8の割合が ...
UTF-8形式の文字コードやSSH2接続に対応するターミナルエミュレーター「UTF-8 TeraTerm Pro with TTSSH2」v4.18が、7月24日に公開された。Windows 98/Me/XP/2000/NT 4.0/Server 2003に対応するフリーソフトで、現在作者のホームページからダウンロードできる。 「UTF-8 TeraTerm Pro with ...
Windows 10の日本語ロケール(日本語文字コード)は慣例的にShift_JISとなっていたが、時代の流れと共にUTF-8化が進んできた。例えばメモ帳で作成したテキストファイルのファイル形式は、すでにANSI(Shift_JIS)からBOMなしUTF-8に変更されている。 このUTF-8を ...
前回に引き続き、 UTF-7によるクロスサイトスクリプティング (XSS) について説明していきます。 UTF-7によるXSSは、 攻撃対象のコンテンツの文字エンコーディングが不明瞭な場合に、 そのコンテンツを被害者のブラウザ (Internet Explorer) で開いたときに ...
パソコン等でファイルを保存するときに、「文字コード」を指定します。 まずはその文字コードとは何なのかを簡単に説明すると 文字コードとはコンピュータが文字を理解するためのルール(エンコード)のことで、UTF-8はその中の一つです。 UTF-8は世界中 ...
potapovnikita mentioned this on Oct 18, 2020 Convert html to pdf: utf-8 works only with text, but not html (unicode/cyrillic not working) #2968 ...