この投稿では、Pythonで文字列から英数字以外の文字を削除する方法について説明します。

1.正規表現を使用する

簡単な解決策は、文字列から英数字以外の文字を削除するために正規表現を使用することです。アイデアは、特殊文字を使用することです \W、単語文字ではない任意の文字に一致します。

ダウンロード  コードを実行する

 
The \W と同等です [^a-zA-Z0-9_]、アンダースコアとともにすべての数字と文字を除外します。アンダースコアも削除する必要がある場合は、次のようにすることができます。

ダウンロード  コードを実行する

 
1つのプログラムで式が複数回使用される場合は、結果の正規表現オブジェクトをコンパイルして保存し、再利用できるようにする必要があります。

ダウンロード  コードを実行する

2.使用する isalnum() 関数

別のオプションは、と一致する文字列をフィルタリングすることです isalnum() 関数。文字列内のすべての文字が英数字の場合はtrueを返し、それ以外の場合はfalseを返します。

ダウンロード  コードを実行する

 
これは次と同等です。

ダウンロード  コードを実行する

Pythonの文字列から英数字以外の文字を削除することはこれですべてです。

 
こちらも参照:

Python文字列から特定の文字を削除する

Python文字列から句読点を削除する