Este prompt gera um infográfico educacional horizontal em chinês, desenhado à mão em tons pastéis, explicando quatro métodos de tokenização com um professor Shiba Inu e um mascote de token azul, ideal para posts científicos em redes sociais.
Um infográfico educacional horizontal fofo, estilo scrapbook desenhado à mão, em chinês, sobre um fundo de papel bege quente com bordas arredondadas, rabiscos em tons pastéis, adesivos de fita, pequenas estrelas e uma estética de caderno de sala de aula. No centro superior, há uma manchete grande em chinês manuscrito divertido: "什么是分词?" (O que é tokenização?), com a segunda metade em rosa coral e o restante em marrom escuro. No canto superior esquerdo, um personagem professor Shiba Inu estilo chibi está de frente, vestindo uma camisa amarelo-pálido e gravata azul, segurando um ponteiro para cima, com um balão de fala que diz "今天来学习分词(Tokenization)!" (Hoje vamos aprender sobre tokenização!). No canto superior direito, um mascote de token quadrado azul fofo rotulado como "TOKEN" está sorrindo, com bochechas coradas, pernas e braços minúsculos e uma lupa; ao lado dele, há um balão de fala dizendo "我是 Token! 被切得越合理,模型越聪明!" (Eu sou um Token! Quanto mais razoavelmente cortado, mais inteligente o modelo!). Perto da borda direita, adicione um pequeno bloco de notas pendurado escrito "知识点 收藏夹" (Pontos de conhecimento - Favoritos) com um ícone de coração. Abaixo da manchete, coloque uma caixa de texto tracejada arredondada contendo a definição: "分词是将人类可读的文本切分成 Token 的过程。" (Tokenização é o processo de dividir texto legível por humanos em Tokens.), com a palavra "Token" destacada em azul. Abaixo disso, adicione uma linha de texto explicativo: "下面以 “程序员Left” 和 “人工智能” 为例,看看不同的分词方式:" (Abaixo, usando "程序员Left" e "人工智能" como exemplos, veja diferentes métodos de tokenização:), com "程序员Left" destacado em azul claro e "人工智能" destacado em rosa. A metade inferior contém exatamente 4 painéis pastéis arredondados dispostos da esquerda para a direita, cada um com um selo numerado e um título. O Painel 1 é verde menta e intitulado "1 词级分词" (Tokenização em nível de palavra). Inclui o subtítulo "按完整语义划分文本" (Dividir texto por semântica completa) e exatamente 3 bolhas de token: "程序员", "Left", "人工智能". Na parte inferior deste painel, mostre o professor Shiba Inu dando um joinha com um balão de fala dizendo "语义完整,容易理解!" (Semântica completa, fácil de entender!). O Painel 2 é amarelo-pálido e intitulado "2 字符级分词" (Tokenização em nível de caractere). Inclui o subtítulo "逐字切分文本" (Dividir texto caractere por caractere) e exatamente 9 bolhas de token circulares organizadas em linhas: "程", "序", "员", "L", "e", "f", "t", "人", "工", "智", "能" — apresentadas visualmente como caracteres individuais do texto de exemplo, em uma grade compacta. Na parte inferior, mostre o mascote de token azul segurando um lápis, com um balão de fala dizendo "粒度最细,但序列会很长~" (Granularidade mais fina, mas a sequência será muito longa~). O Painel 3 é rosa-pálido e intitulado "3 子词分词" (Tokenização em subpalavras). Inclui o subtítulo "按词根以及前后缀划分" (Dividir por radicais e prefixos/sufixos) e exatamente 5 bolhas de token: "程序", "员", "Left", "人工", "智能". Na parte inferior, mostre o professor Shiba Inu pensando com uma pata na boca e um ponto de interrogação acima da cabeça, com um balão de fala dizendo "折中方案,效果 often 很好!" (Solução de compromisso, o efeito costuma ser muito bom!). O Painel 4 é azul-pálido e intitulado "4 字节级分词" (Tokenização em nível de byte). Inclui o subtítulo "将字词转为字节编码,根据转换后的内容进行组合和划分" (Converter palavras em codificação de bytes, combinar e dividir de acordo com o conteúdo convertido) e exibe exatamente 14 pequenas bolhas de código circulares: "E7", "A8", "8B", "...", "66", "74", "E4", "BA", "BA", "E8", "83", "BD", "..." organizadas em várias linhas como bytes codificados. Na parte inferior, mostre o mascote de token azul novamente, sorrindo, com um balão de fala dizendo "适合处理任意文本!" (Adequado para processar qualquer texto!) e um pequeno rabisco de lâmpada por perto. Na parte inferior, coloque uma nota em banner arredondado que diz: "不同分词方式各有优势,实际应用中会根据任务和数据选择合适的方案哦!" (Diferentes métodos de tokenização têm suas próprias vantagens; na aplicação prática, a solução apropriada será escolhida de acordo com a tarefa e os dados!). Use verde, amarelo, rosa e azul pastéis suaves para os quatro painéis, texto manuscrito marrom escuro, sombras sutis, formas arredondadas e expressões kawaii adoráveis por toda parte. Mantenha a composição equilibrada, limpa e amigável, como um pôster explicativo de ciência para redes sociais.