Unicode区切り文字で文字列を分割しますか? [複製]

splitting a string with a unicode delimiter? [duplicate]


質問 written by Burhan Khalid @2017-02-19 03:38:30Z

: 0 : 1 : 1

この質問にはすでに答えがあります:

与えられた文字列:

str = 'Led Zeppelin — Blackdog'

で分割するにはどうすればいいですか?

['Led Zeppelin', 'Blackdog']

しかしはハイフンではありません。 u'\u2014'としてエンコードされます

どうすればいいのですか?

コメント 1

str.split(u'—')またはstr.split(u'\u2014')

written by -alvas @2017-02-19 03:36:45Z

回答 1 written by コミュニティ @2017-05-23 10:29:37Z
1

それがハイフンではなく 、文字に標準で含まれている場合は空白文字で囲まれていることを明確にしたい場合は、提供したものを明示的に分割することができます。 また、変数名としてstr使用してビルトインをシャドウしないでください。

>>> s = 'Led Zeppelin — Blackdog'
>>> s.split(u' \u2014 ')
['Led Zeppelin', 'Blackdog']
>>> s.split(' — ') # perhaps less explicit
['Led Zeppelin', 'Blackdog']