twitter facebook

MySQL 8.0の標準の照合順序「utf8mb4_0900_ai_ci」

utf8mb4

マルチバイトを4バイト(通常3バイト)のUTF8の文字コードで以下のようにロバストな感じです。かなカナ変換が不必要になったり、もちろん絵文字も普通に扱えるようです。

0900

Unicodeのバージョン 9.00

ai

Accent Insensitive
アクセントの違いは無視

ci

Case Insensitive
大文字と小文字の違いを無視

整理すると

ほ と ぽ、あ と ぁ、あ と ア が同一視されるので、プログラム側でいちいち置換などの作業が極力少ない状態で検索できます。
Insensitiveは鈍感の意味で、
LIKE '%ドーク%' で検索すると ドーク、トーク、トーグ などがマッチします。あと LIKE '%どーく%' とひらがなで検索しても ドーク、トーク、トーグ はマッチします。
AUTHOR
@えのえの
最終更新日 2022/04/29
FAVORITE good stock
LINK TAG
記法を見る