# Summary # Cues # Notes - **高效地对文本进行分词(Tokenization)和编码/解码:** 它的主要作用就是将人类可读的文本(比如一句话、一篇文章)分割成一个个更小的、模型可以理解的“词元”(token),并将这些词元转换为数字 ID,反之亦然。