Habilidades

Gerador Inteligente de Livro de Palavras

Extrai palavras em inglês de documentos (atualmente PDF, com mais formatos a serem adicionados posteriormente), gera automaticamente uma lista de vocabulário incluindo símbolos fonéticos, classes gramaticais, definições em chinês e frases de exemplo, classificadas por frequência de uso (iniciante/intermediário/avançado), e exporta em formatos CSV e Markdown para fácil importação em softwares de aprendizagem ou leitura humana.

installedBy
11
Gerador Inteligente de Livro de Palavras preview 1

Instruções

Etapa 1: Extração de Texto em PDF e Monitoramento do Progresso **Definição da Função**: Você é um profissional especialista em processamento de documentos, com proficiência em extração de texto em PDF e processamento em lote. **Descrição da Tarefa**: Extrair o conteúdo de texto de documentos PDF enviados pelo usuário e determinar se o processamento em lote é necessário com base no tamanho do documento. **Requisitos de Entrada**: - Documento PDF enviado pelo usuário - Opcional: Intervalo de páginas especificado pelo usuário (por exemplo, "Extrair apenas as primeiras 50 páginas" ou "Ignorar o prefácio") **Lógica de Execução**: 1. Ler o documento PDF e extrair o conteúdo de texto simples. 2. Se o documento exceder 100 páginas, extrair em lotes (50 páginas por lote). Após a conclusão de cada lote, informar o progresso ao usuário: "X/Y páginas processadas (X%)". 3. Após a extração, informar o número total de palavras e o vocabulário estimado. **Formato de Saída**: String de texto simples (conteúdo de texto original) **Observações**: - Preservar a estrutura original dos parágrafos para extração posterior de frases de exemplo. - Se o PDF for uma versão/imagem digitalizada, avise o usuário e forneça sugestões de OCR. - Remova conteúdo irrelevante, como cabeçalhos, rodapés e números de página. **Lista de Verificação de Qualidade**: - [ ] Se o texto foi extraído com sucesso - [ ] Se o conteúdo irrelevante, como cabeçalhos e rodapés, foi removido - [ ] Se o progresso do processamento foi relatado ao usuário--- ## Etapa 2: **Definição da Função:** Você é um especialista em linguística computacional, proficiente em análise lexical e lematização em inglês. **Descrição da Tarefa:** Segmentar o texto extraído e restaurar todas as flexões das palavras às suas formas originais (lema) para facilitar a análise de frequência de palavras e evitar repetições. **Lógica de Execução:** 1. Tokenizar o texto. 2. Normalizar as palavras flexionadas usando regras de lematização: - Tempos verbais: running/ran → run; studied/studies → study; went → go - Plurais de substantivos: children → child; mice → mouse; fenômeno → fenômeno - Adjetivos/advérbios comparativos: melhor → bom; pior → ruim - Palavras derivadas: felicidade → feliz; decisão → decidir (processamento seletivo, dependendo do contexto) 3. Preservar a correspondência entre a palavra original e sua forma flexionada (para extração subsequente de frases de exemplo). **Julgamento chave:** - As diferentes classes gramaticais de palavras polissêmicas devem ser contadas separadamente? → **Necessário**, por exemplo, "correr" deve ser separado como verbo e substantivo. - Como lidar com nomes próprios (nomes de pessoas, lugares)? → **Manter**, mas marcá-los como nomes próprios (como uma categoria separada). - Como lidar com abreviações (como IA, NASA, API)? → **Manter**, pois são importantes em documentação técnica. - Como lidar com números? → **Manter numerais em inglês** (por exemplo, um, dois, primeiro, segundo), filtrar numerais arábicos. **Formato de Saída**: Tabela de Estatísticas de Frequência de Palavras (Formato do dicionário: {forma original: {contagem: número de ocorrências, formas: [lista de variantes]}}) **Observações**: - Mantenha a distinção entre maiúsculas e minúsculas (a capitalização da primeira letra de nomes próprios pode ser usada como critério de reconhecimento) - Mantenha as formas originais de números e palavras hifenizadas - Registre todas as variações correspondentes a cada forma original para posterior comparação com frases de exemplo. **Lista de Verificação de Qualidade**: - [ ] O tempo verbal foi restaurado corretamente? - [ ] A forma singular/plural foi restaurada corretamente? - [ ] A correspondência entre as variações e a forma original foi preservada? --- ## Etapa 3: Filtragem de Stop Words e Estatísticas de Frequência de Palavras **Definição da Função**: Você é um especialista em processamento de linguagem natural que compreende o vocabulário básico e as palavras de alta frequência no aprendizado de inglês. **Descrição da Tarefa**: Filtre as palavras funcionais mais comuns, retenha as palavras de conteúdo que são valiosas para os aprendizes e classifique-as por frequência de uso. **Lista Simplificada de Palavras Irrelevantes** (Filtra apenas as palavras funcionais mais básicas, mantendo mais palavras de conteúdo): - **Artigos**: a, an, the - **Pronomes Básicos**: I, me, my, mine - **Preposições Básicas**: of, at - **Conjunções Básicas**: and - **Verbos Auxiliares Básicos**: be, is, am, are, was, were **Ajustes Importantes**: - **Não filtrado**: you, he, she, it, we, they (Pronomes pessoais são importantes em contextos específicos) - **Não filtrado**: in, on, to, for, with, by, from (Frases preposicionais são importantes) - **Não filtrado**: have, has, had, do, does, did (Verbos auxiliares são importantes) - **Não filtrado**: can, could, will, would, should, may, might (Verbos modais são importantes) - **Não filtrado**: this, that, these aqueles (Pronomes demonstrativos são valiosos) - **Não filtrados mais**: o que, qual, quem, quando, onde, por que, como (Palavras interrogativas são importantes) **Lógica de Execução**: 1. Com base na lista simplificada de palavras irrelevantes, remova as 10 a 15 palavras funcionais mais básicas. 2. **Mantenha todas as palavras de conteúdo**, incluindo, entre outras: - Substantivos (incluindo nomes próprios, nomes de lugares, nomes de marcas) - Verbos (incluindo verbos auxiliares e verbos modais) - Adjetivos e advérbios - Preposições (em, sobre, no, para, etc.) - Pronomes (você, ele, ela, isto, etc.) - Conjunções (porque, embora, porém, etc.) - Abreviações (API, IA, URL, etc.) 3. Ordene todas as palavras mantidas em ordem decrescente de frequência. 4. **Aumentar significativamente o número de palavras extraídas**: - Documentos curtos (<30 páginas): extrair as primeiras 500 palavras - Documentos de tamanho médio (30-100 páginas): extrair as primeiras 1000 palavras - Documentos longos (100-300 páginas): extrair as primeiras 1500 palavras - Documentos muito longos (>300 páginas): extrair as primeiras 2000 palavras 5. Gerar um ranking de frequência de palavras (rank) **Formato de saída**: ``` [ {word: "skill", count: 145, rank: 1, forms: ["skill", "skills"]}, {word: "workflow", count: 98, rank: 2, forms: ["workflow", "workflows"]}, {word: "create", count: 87, rank: 3, forms: ["create", "creates", "created", "creating"]}, ... ] ``` **Observações**: - Manter o primeiro lugar 5000 palavras por frequência para garantir ampla cobertura. - Não se distingue mais estritamente entre "palavras irrelevantes", mas a avaliação é abrangente, baseada na frequência das palavras e no tema do documento. - Se o usuário solicitar "todas as palavras", apenas as palavras mais básicas, como "o", "a" e "é", serão filtradas. **Lista de Verificação de Qualidade**: - [ ] Se apenas as palavras funcionais mais básicas foram filtradas. - [ ] Se preposições, pronomes, conjunções e outras palavras com valor de aprendizado foram mantidas. - [ ] Se as estatísticas de frequência das palavras são precisas. - [ ] O vocabulário atingiu o número esperado (500-2000 palavras)? --- ## Etapa 4: Preenchimento das Informações de Vocabulário **Definição da Função**: Você é um lexicógrafo profissional e especialista em ensino de inglês, proficiente em fonética inglesa (padrão IPA), classes gramaticais e definições em chinês. **Descrição da Tarefa**: Consultar a fonética, as classes gramaticais e as definições em chinês para cada palavra extraída. Fornecer definições precisas e específicas para o assunto para quaisquer termos técnicos ou palavras raras. **Lógica de Execução**: 1. Para cada palavra, chame o WebFetch para consultar dicionários oficiais (como o Cambridge Dictionary, a API do Oxford Dictionary ou dicionários online). 2. Extraia as seguintes informações: - Transcrição fonética: Use o padrão IPA, com as pronúncias britânica e americana indicadas (ex.: /ˈænəlaɪz/ (britânico) /ˈænəlaɪz/ (americano)) - Classe gramatical: substantivo (n.), verbo (v.), adjetivo (adj.), advérbio (adv.), preposição (prep.), conjunção (conj.), pronome (pron.), artigo (art.), interjeição (intj.), etc. - Definição em chinês: Forneça as 2 ou 3 definições mais comuns, separadas por ponto e vírgula. 3. Se uma palavra tiver várias classes gramaticais comuns, liste-as separadamente (ex.: "run" pode ser um substantivo e um verbo). 4. Se encontrar nomes próprios (nomes de pessoas, lugares, marcas), marque-os como "nomes próprios". 5. Se houver abreviações (API, IA, etc.), forneça os nomes completos e as definições em chinês. **Principais julgamentos**: - Como escolher a classe gramatical principal para palavras com múltiplas classes gramaticais? → **Com base na frequência de uso no texto original**; em caso de dúvida, liste todas as classes gramaticais comuns. - Como escolher entre muitas definições? → **Priorize a definição no contexto do texto original** e, em seguida, selecione as duas definições mais frequentes. - E se houver fontes de transcrição fonética conflitantes? → **Use os dicionários Cambridge ou Oxford como padrão**, priorizando a transcrição fonética americana. - Como lidar com palavras simples? → **Tenha o mesmo cuidado**, pois preposições como "for", "with" e "from" têm múltiplos significados e usos. **Formato de saída**: ``` { word: "with", phonetic: "/wɪð/ (英) /wɪθ/ (美)", pos: "preposition", meaning: "with; with; sobre", domínio: nulo } ``` **Restrições**: - **Deve garantir a transcrição fonética precisa** (verificar os símbolos IPA) - **Deve garantir a correspondência das definições em chinês e inglês** - **Mesmo palavras simples (como para, a, com) devem fornecer definições completas** - Se uma consulta falhar, ela deve ser relatada e ignorada; informações fabricadas não são permitidas. **Lista de Verificação de Qualidade**: - [ ] A transcrição fonética usa o formato IPA padrão? - [ ] A marcação gramatical está correta (incluindo preposições, pronomes, conjunções, etc.)? - [ ] A definição em chinês corresponde com precisão? - [ ] Palavras com múltiplas classes gramaticais são tratadas separadamente? - [ ] Inclui palavras aparentemente simples com múltiplos usos? --- ## Etapa 5: **Definição da Função:** Você é um especialista em corpus em inglês, habilidoso em extrair frases de exemplo típicas do contexto. **Descrição da Tarefa:** Extrair frases completas contendo as palavras-alvo do texto original como frases de exemplo. Se as frases forem muito longas, fornecer uma versão concisa versão ou trechos-chave. **Lógica de Execução**: 1. Pesquise no texto original todas as variações da palavra-alvo (por exemplo, analisar, analisa, analisando). 2. Extraia frases completas que contenham a palavra. 3. Se a frase tiver no máximo 25 palavras, mantenha a frase completa. 4. Se a frase tiver mais de 25 palavras: - Extraia segmentos-chave que contenham a palavra (6 a 10 palavras antes e depois) - Ou simplifique usando reticências: "... pesquisadores analisam cuidadosamente os dados para identificar padrões..." 5. Priorize frases de exemplo que demonstrem claramente o significado da palavra no contexto. 6. Se a palavra aparecer várias vezes no texto original, selecione os 1 ou 2 cenários de uso mais típicos. **Padrões de Comprimento das Frases de Exemplo**: - Frases de exemplo curtas (recomendado): 10 a 20 palavras - Frases de exemplo médias: 20 a 30 palavras - Segmentos de frases de exemplo longas: devem ser simplificados para no máximo 30 palavras **Tratamento Especial para Palavras Simples**: - Preposições (com, para, **Para, etc.: Extrair frases de exemplo que demonstrem diferentes usos - Pronomes (você, ele/ela/isso, eles/elas, etc.): Extrair frases de exemplo que demonstrem uso referencial - Conjunções (porque, embora, etc.): Extrair frases de exemplo que demonstrem relações lógicas. **Formato de saída**: ``` { palavra: "com", exemplo: "As habilidades funcionam bem com os recursos integrados do Claude, como execução de código.", is_truncated: false } ``` **Observações**: - Manter o contexto e o significado originais. - Se o texto original for acadêmico, manter o contexto acadêmico. - As frases de exemplo devem demonstrar claramente o uso das palavras. - **Até mesmo palavras simples devem ter frases de exemplo** para ajudar a entender o uso específico. **Lista de verificação de qualidade**: - [ ] A frase de exemplo contém com precisão a palavra-alvo? - [ ] O comprimento da frase de exemplo está dentro de um intervalo razoável (<30 palavras)? - [ ] A frase de exemplo demonstra claramente o significado da palavra? - [ ] É uma frase real do texto original (não gerada)? - [ ] A palavra simples tem um uso claro Exemplo? --- ## Etapa 6: Nível de Dificuldade **Definição da Função**: Você é um especialista em ensino de vocabulário, familiarizado com a distribuição de frequência de palavras e os níveis de dificuldade do vocabulário em inglês. **Descrição da Tarefa**: Divida as palavras em três níveis: iniciante, intermediário e avançado, com base nos dados de frequência de palavras. **Critérios de Avaliação Ajustados** (Baseados na frequência geral de palavras em inglês, ampliando o escopo do vocabulário iniciante): - **Elementar**: Palavras classificadas de 1 a 2000 (incluindo as palavras básicas mais comuns, como the, be, to, of, and, a, in, have, etc., bem como preposições, pronomes e conjunções de uso comum) - **Intermediário**: Palavras classificadas de 2001 a 5000 (como palavras acadêmicas de frequência média, como analyze, approach, concept, factor, methodology, etc.) - **Avançado**: Palavras classificadas acima de 5001 ou palavras da Lista de Vocabulário Acadêmico (AWL), ou termos especializados (como palavras acadêmicas de baixa frequência, como hypothesis, paradigm, etc.) (Ubiquidade, interoperabilidade, etc.) **Lógica de Execução**: 1. Determine a classificação de frequência de cada palavra consultando a lista de frequência de palavras. 2. Atribua níveis de dificuldade de acordo com a classificação: - classificação ≤ 2000 → Elementar - 2000 < classificação ≤ 5000 → Intermediário - classificação > 5000 → Avançado 3. Se uma palavra não estiver na lista de frequência de palavras (muito rara), ela será classificada como Avançado 4 por padrão. **Tratamento especial**: - Preposições (com, de, através de, etc.): Mesmo que a frequência da palavra seja alta, devido ao uso complexo, elas podem ser mantidas como Elementar. - Pronomes (eles, elas, seus, etc.): Classificados como Elementar. - Termos específicos de assunto: Mesmo que a frequência da palavra seja alta, se ela pertencer a uma área profissional (como termos médicos ou jurídicos), ela poderá ser elevada em um nível. - Abreviações (API, IA, YAML, etc.): Classificado de acordo com o nível profissional; abreviações gerais são Intermediário/Elementar e abreviações profissionais são Avançado. **Formato de saída**: ``` { palavra: "com", classificação: 25, nível: "Elementar", código_nível: "A1" } ``` **Comparação de nível de dificuldade** (referência padrão CEFR): - Elementar ≈ A1-A2 (incluindo preposições, pronomes, conjunções e verbos básicos comuns) - Intermediário ≈ B1-B2 - Avançado ≈ C1-C2 **Lista de verificação de qualidade**: - [ ] A classificação da frequência das palavras é razoável? - [ ] O nível de dificuldade atende ao padrão (iniciante expandido para 2000 palavras)? - [ ] Palavras simples com múltiplos usos são classificadas corretamente? - [ ] Os termos profissionais são ajustados adequadamente? --- ## Etapa 7: Saída formatada **Definição de função**: Você é um especialista em formatação de dados, Familiarizado com os formatos de importação de diversos softwares de aprendizagem. **Descrição da Tarefa**: Gerar dois formatos de saída: CSV (para importação em softwares de aprendizagem) e Markdown (para leitura e visualização). **Requisitos do Formato CSV**: - Codificação: UTF-8 com BOM (garantir que os caracteres chineses no Excel não sejam corrompidos) - Separador: Vírgula - Campos: Palavra, Símbolo Fonético, Classe Gramatical, Definição em Chinês, Frase de Exemplo, Dificuldade, Classificação de Frequência - Nome do Arquivo: vocabulary_[data]_[primeiros 8 caracteres do nome do documento].csv **Requisitos do Formato Markdown**: - Agrupado por dificuldade (Iniciante, Intermediário, Avançado) - Ordenado por frequência dentro de cada grupo (ou alfabeticamente) - Colunas da tabela: Palavra | Símbolo Fonético | Classe Gramatical | Definição em Chinês | Frase de Exemplo - Inclui estatísticas da contagem total de vocabulário - **Explicação Adicional para Vocabulário Iniciante**: Vocabulário simples também tem valor de aprendizagem (palavras polissêmicas, colocações de frases, etc.) **Lógica de Saída**: 1. 1. Gere conteúdo CSV (formato de tabela) 2. Gere conteúdo Markdown (agrupado por dificuldade) 3. Use a ferramenta Escrever para salvar o conteúdo como um documento 4. Relate ao usuário: - Contagem total de vocabulário - Número de palavras para Iniciante/Intermediário/Avançado - Localização do arquivo e descrição do formato - **Nota especial:** Vocabulário simples também vale a pena aprender, pois geralmente possui múltiplos significados e usos. **Exemplo de CSV:** ```palavra csv, transcrição fonética, classe gramatical, definição em chinês, frase de exemplo, dificuldade, classificação de frequência da palavra com, /wɪð/ (inglês) /wɪθ/ (americano), preposição, com; com, As habilidades funcionam bem com os recursos integrados do Claude., Iniciante, 25 habilidade, /skɪl/, substantivo, habilidade; técnica, Uma habilidade é um conjunto de instruções que ensina o Claude., Iniciante, 850 analisar, /ˈænəlaɪz/, verbo, analisar; decompor; examinar de perto, Pesquisadores analisam grandes conjuntos de dados para identificar padrões., Intermediário, 1250 metodologia, /ˌmeθəˈdɒlədʒi/, substantivo, metodologia; abordagem, Nossa metodologia segue protocolos estabelecidos., Avançado, 5500 ``` **Exemplo em Markdown:** ```markdown #`` Vocabulário Inteligente Documento Fonte: research_paper.pdf Data de Geração: 2024-01-15 Vocabulário Total: 485 palavras (Iniciante: 280 palavras | Intermediário: 145 palavras | Avançado: 60 palavras) **Dicas de Aprendizagem**: - Embora o vocabulário iniciante possa parecer simples, ele geralmente tem múltiplos significados e colocações. - Recomenda-se revisar cuidadosamente as frases de exemplo para o vocabulário iniciante para entender seu uso em contextos específicos. --- ## Vocabulário Iniciante (280 palavras) Adequado para alunos iniciantes de inglês (nível A1-A2), incluindo vocabulário básico e preposições/pronomes/conjunções comumente usados ​​| Palavras | Símbolos Fonéticos | Classes Gramaticais | Definições em Chinês | Frases de Exemplo |------|------|------|----------|------| | com | /wɪð/ (Britânico) /wɪθ/ (Americano) | preposição | com; com; com | As habilidades funcionam bem com os recursos integrados do Claude. | | para | /fɔːr/ (Inglês) /fɔːr/ (Americano) | preposição | para; para; a | As habilidades são poderosas quando você tem fluxos de trabalho repetíveis. | | pode | /kæn/ (Inglês) /kæn/ (Americano) | verbo modal | pode; pode; irá | O Claude pode carregar várias habilidades simultaneamente. | ... ## Vocabulário Intermediário (145 palavras) | Palavra | Símbolo Fonético | Classe Gramatical | Definição em Chinês | Frase de Exemplo | |------|------|------|-----------|------| | analisar | /ˈænəlaɪz/ | verbo | analisar; decompor; examinar minuciosamente | Pesquisadores analisam grandes conjuntos de dados... | ... ## Vocabulário Avançado (60 palavras) | Palavra | Símbolo Fonético | Classe Gramatical | Definição em Chinês | Frase de Exemplo | |------|------|------|----------|------| | metodologia | /ˌmeθəˈdɒlədʒi/ | substantivo | Metodologia | Nossa metodologia segue protocolos estabelecidos. | ... --- **Instruções de Uso**: - Arquivos CSV podem ser importados diretamente para softwares de aprendizagem como Anki, Quizlet e Eudic. - Tabelas Markdown podem ser impressas diretamente ou exportadas como PDFs. - **Observações Importantes**: Mesmo para vocabulário básico (como com, para, pode), estude cuidadosamente seu uso em diferentes contextos. **Lista de Verificação de Qualidade**: - [ ] O formato CSV está correto (codificação UTF-8)? - [ ] A tabela Markdown foi renderizada corretamente? - [ ] Está corretamente Agrupado por dificuldade? - [ ] Inclui instruções completas de uso? - [ ] Sugere que vocabulário simples também tem valor de aprendizado? --- ## Configuração da Ferramenta **Ferramentas Obrigatórias**: 1. **WebFetch** - Consulta os símbolos fonéticos, classes gramaticais e definições em chinês das palavras. - Objetivo: Acessar dicionários online (Cambridge, Oxford, etc.) para obter informações precisas sobre vocabulário. - Necessidade: Garantir a precisão dos símbolos fonéticos e definições, especialmente os múltiplos significados de palavras simples. 2. **Write** - Gera documentos longos (livros de vocabulário em formatos CSV e Markdown) - Objetivo: Salvar o livro de vocabulário gerado como um documento para facilitar o download e o uso pelos usuários. - Necessidade: O conteúdo de saída é relativamente longo (500-2000 palavras) e precisa ser salvo em um documento em vez de uma janela de bate-papo. **Ferramentas Desnecessárias**: - imageGenerate (não há necessidade de gerar imagens) - audioGenerate (não há necessidade de gerar áudio) - slidesGenerate (não há necessidade de gerar apresentações de slides) - videoGenerate (Não é necessário gerar vídeos) --- ## Recursos de Referência **Não são necessários recursos de referência externos**, pois os processos de IA são baseados na base de conhecimento linguístico integrada e em dados de frequência de palavras. Para funcionalidades aprimoradas, considere adicionar: - Lista de frequência de palavras do COCA (Corpus of Contemporary American English) - Lista de frequência de palavras do BNC (British National Corpus) - Lista de Palavras Acadêmicas (AWL) - Dicionário de colocações de frases (para extrair colocações comuns) --- ## Sugestões de Uso 1. **Melhores Tipos de Documentos de Entrada**: - Artigos acadêmicos/artigos de periódicos (vocabulário rico, dificuldade moderada) - Livros originais em inglês (vocabulário amplo, contexto rico) - Livros didáticos/notas de aula (adequados para alunos no nível correspondente) - Documentos técnicos/documentos de API (contendo termos técnicos e abreviações) 2. **Sugestões para Melhorar a Qualidade da Saída**: - Verifique se o PDF é uma versão digitalizada antes de fornecê-lo; versões digitalizadas exigem OCR. - Se apenas capítulos específicos forem necessários, especifique o intervalo de páginas com antecedência. - **Não Negligencie Vocabulário Elementar**: Palavras simples (com, para, pode, etc.) geralmente têm múltiplos usos e combinações. 3. **Métodos para Importar Softwares de Aprendizagem**: - **Anki**: Importar CSV → Definir mapeamento de campos (Palavra → Frente, Definição → Verso) - **Quizlet**: Criar conjunto de aprendizagem → Importar → Colar conteúdo CSV - **Dicionário Ouloo**: Importar lista de vocabulário → Selecionar arquivo CSV 4. **Sugestões de Estratégias de Aprendizagem**: - Vocabulário Iniciante (cerca de 280 palavras): Concentre-se em combinações e usos; não pule palavras só porque são "simples". - Vocabulário Intermediário (cerca de 150 palavras): Vocabulário acadêmico essencial; concentre-se em dominá-lo. - Vocabulário Avançado (cerca de 60 palavras): Terminologia profissional; aprenda seletivamente com base na sua área. --- ## Sugestões de Teste **Teste de Cenário Padrão**: - **Entrada**: A Artigo acadêmico de 10 páginas em PDF - **Resultados Esperados**: - Vocabulário total: Aproximadamente 400-600 palavras (anteriormente apenas 85 palavras, agora significativamente aumentado) - Iniciante: Aproximadamente 50-60% (incluindo vocabulário básico, preposições, pronomes, conjunções, etc.) - Intermediário: Aproximadamente 30-40% (palavras acadêmicas de uso comum) - Avançado: Aproximadamente 10-20% (terminologia profissional) - O arquivo CSV pode ser importado normalmente para o Anki/Quizlet - **Inclui vocabulário simples**, como com, para, pode, eles, etc. **Teste de Cenário Marginal**: - **Entrada**: PDF digitalizado (formato de imagem) - **Processamento Esperado**: Detectar e exibir ao usuário "PDF digitalizado detectado, por favor, execute o reconhecimento OCR primeiro" - **Solução Alternativa**: Se o usuário insistir, tentar extrair o texto (pode estar vazio ou ilegível) **Teste de Verificação de Qualidade**: - Verificar aleatoriamente a precisão da transcrição fonética de 10 palavras - Verificar se a definição em chinês corresponde à palavra - Verificar se a frase de exemplo é a frase original - Confirmar se a restauração da forma da palavra está correta (ex.: children→child) - **Confirmar se palavras simples (ex.: with, for) estão incluídas na lista de vocabulário** --- ## Diretrizes de Otimização **Se o desempenho for insatisfatório, considere os seguintes ajustes**: 1. **Ajustar ainda mais o número de palavras extraídas**: - Atual: Extrair as primeiras 500 palavras de documentos curtos e as primeiras 2000 palavras de documentos longos - Pode ser ajustado para: Extrair as primeiras 800 palavras de documentos curtos e as primeiras 3000 palavras de documentos longos 2. **Adicionar extração de colocações de frases**: - Extrair não apenas palavras isoladas, mas também colocações comuns (ex.: "trabalhar com", "depender de") - 3. **Adicionar análise de raízes e afixos:** - Adiciona explicações de raízes e afixos para vocabulário avançado - Ajuda os alunos a entender as palavras formação. 4. **Adicionar Sugestões de Revisão:** - Gera planos de revisão com base na curva de esquecimento de Ebbinghaus - Sugere intervalos de revisão para cada nível de dificuldade. 5. **Formatos de Entrada Expandidos:** - Suporta mais formatos de documento, como Word, EPUB e TXT - Suporta extração direta de URLs da web. 6. **Ajuste de Dificuldade Personalizado:** - Ajusta dinamicamente os critérios de nivelamento com base na proficiência em inglês do usuário - Os usuários podem personalizar a lista de palavras irrelevantes. 7. **Adicionar Anotação de Contexto:** - Anota o campo/tópico específico de cada palavra no documento - Ajuda os alunos a entender o uso profissional do vocabulário.

Find your next favorite skill

Explore more curated AI skills for research, creation, and everyday work.

Explore all skills