文字コードに関する問題は大別すると文字集合の問題と文字エンコーディングの問題に分類できる。前回は文字集合の取り扱いに起因するぜい弱性について説明したので、今回は文字エンコーディングに起因するぜい弱性について説明しよう。 文字 ...
前回に引き続き、 今回も文字エンコーディングとセキュリティをテーマに解説します。前回は壊れた文字エンコーディングを利用した攻撃、 文字エンコーディングを誤認識させる攻撃を紹介しました。今回はSJIS特定の問題を簡単に紹介します。 文字 ...
前回に引き続き、 今回も文字エンコーディングとセキュリティをテーマに解説します。前回は文字エンコーディングを利用した攻撃で、 JavaScriptインジェクションやSQLインジェクションなどが可能であることを紹介しました。今回はなぜ、 文字 ...
自然言語処理(NLP)では、「単語」や「文章」のような文字情報を機械学習モデルに入力するために、数値ベクトルへ変換する必要があります。 その最も基本的な変換方法が One-Hot Encoding(ワンホットエンコーディング) です。 テキストデータ(単語や ...
「テキストエンコーディング」は、「Google Chrome」v55以降で廃止されたエンコーディング選択メニューの機能を代替する拡張機能。編集部にてWindows 10上の「Google Chrome」v57.0.2987.133で動作を確認した。“Chrome ウェブストア”からダウンロードできる。 「Google ...
一般社団法人Pythonエンジニア育成推進協会はコラム「第16回「scikit-learnの使い方(2)カテゴリ変数のエンコーディングと特徴量の正規化」」を公開しました。 こんにちは、小澤です。 今回も引き続き、「scikit-learn」における前処理について解説していきます。
Q-Successから2019年11月のWebサイト向け文字エンコーディングのシェアが発表された。2019年11月はUTF-8がシェアを増やし、ISO-8859-1とWindows-1252がシェアを減らした。 ISO-8859-1とWindows-1252はラテンアルファベットの文字コード標準で、米国、欧州、オーストラリア ...
"発生場所 S:\test.ps1:3 文字:1+ [Console]::OutputEncoding = [System.Text.Encoding]::GetEncoding('utf-.+ CategoryInfo : NotSpecified ...
あるアプリで作成したデータを別のアプリに取り込んで使う場面というのは意外と多いものです。その中でも多いのが、CSVファイルのインポートとエクスポートです。CSVであればExcelやGoogleスプレッドシートなどで開いて手軽に編集できます。 しかし、その ...
Most languages use word position and sentence structure to extract meaning. For example, "The cat sat on the box," is not the ...