クロスサイト・スクリプティングという言葉は元々,WebアプリケーションのHTMLエンコード漏れなどを利用することによって第三者にJavaScriptを実行させる手法を指す。広義では,HTMLのエンコードによる画面改変などを含むこともある。 前回述べたように ...
HTML Living Standardには、文字エンコーディング宣言について以下の定義がある。 Regardless of whether a character encoding declaration is present or not, the actual character encoding used to encode the document must be UTF-8.
文字コードに関する問題は大別すると文字集合の問題と文字エンコーディングの問題に分類できる。前回は文字集合の取り扱いに起因するぜい弱性について説明したので、今回は文字エンコーディングに起因するぜい弱性について説明しよう。 文字 ...
前回に引き続き、 今回も文字エンコーディングとセキュリティをテーマに解説します。前回は文字エンコーディングを利用した攻撃で、 JavaScriptインジェクションやSQLインジェクションなどが可能であることを紹介しました。今回はなぜ、 文字 ...
クロスサイトスクリプティングの危険性を解説した 「CERT Advisory CA-2000-02 Malicious HTML Tags Embedded in Client Web Requests」 (⁠2000年2月) には、 クロスサイトスクリプティングを防止する対策として文字エンコーディングを明示的に指定すべきある、 と明確に記載 ...
This package implements the HTML Standard's encoding sniffing algorithm in all its glory. The most interesting part of this is how it pre-scans the first 1024 bytes ...
Thanks you guys for the great framework. I am using scrapy to crawl multiple sites. Sites are diffrerent encodings. One site is encoding as 'gbk' and it's declared in HTML meta. but scrapy can not ...