Common Voice Spontaneous Speech 1.0 - Papantla Totonac

Specifics

Licensing

CC0-1.0

https://creativecommons.org/publicdomain/zero/1.0/legalcode

Considerations

Restrictions/Special Constraints

You agree that you will not re-host or re-share this dataset

Forbidden Usage

You agree not to attempt to determine the identity of speakers in the Common Voice dataset

Processes

Intended Use

This dataset is intended to be used for training and evaluating automatic speech recognition (ASR) models. It may also be used for applications relating to computer-aided language learning (CALL) and language or heritage revitalisation.

Metadata

Papantla Totonac — Papantla Totonac (`top`)

Esta hoja de datos ha sido generada automáticamente, nos encantaría incluir más información, si deseas ayudar, ¡ponte en contacto con nosotros!

Esta ficha técnica corresponde a la versión 1.0 del conjunto de datos Spontaneous Speech (habla espontánea) de Mozilla Common Voice para Papantla Totonac (top). El conjunto de datos contiene 411 representando 11 horas de grabaciones (11 horas validadas) de 10 hablantes.

Información demográfica

El conjunto de datos incluye la siguiente distribución de edad y género.

Género

Información de género autodeclarada; la frecuencia se refiere al número de fragmentos anotados con este género.

Edad

Información de edad autodeclarada; la frecuencia se refiere al número de fragmentos anotados con esta franja etaria.

Partición de datos para modelado

Partición	Cuenta
Train	264
Dev	69

Transcripciones

Prompts: 143
Duration: 38512944[ms]
Avg. Transcription Len: 630
Avg. Duration: 93.71[s]
Valid Duration: 38021.33[s]
Total hours: 10.7[h]
Valid hours: 10.56[h]

Preguntas

A continuación se muestra una selección aleatoria de las preguntas usadas en el corpus.

Tuku lank'a tapuwan tlawaputuna xlimakgas, chu wana?
Nikula tatasi chikijni xalak minpulataman?
Tukuya xpumakin likan makuani milatamat?
Tiku kamakgtakgalha titakgalhinan nakminpulatanan?
Nikula xtalhakgen laktsukaman xalitutunaku?

Respuestas

A continuación se muestra una selección aleatoria de respuestas transcritas del corpus.

Jé tlan tu anankgoy nak kin pulatamant nak ki pulataman wi lakchixcuwin tamatakuxtunan tahan chali chali xkgaka katlawanican xchaokan talin ana tawayanacha ana takgalstuyunnancha xa lak chajan tatamakxtakgayacha nakx chikgan tamawi xtilan, paxne tamakgtakgalha xkitsistankganin nachu wi laxumajan, lakgawasan tahan taskuja nak kachikin chali chali tahan nak putlao tataju ana taxhoco nama wanican xpasajekan. laktsukaman chali chali tahan nak pukaltawaca tahan takgatsini laksasti takatsin kamasinikan tipakgatsi tu natamakgkuani xlatamatkgan. nawi tu anan tu nitlan, nama tu nitlan axni lakgawasan tsuku tatapaxtumi lakgawasan nema ni tahan nak pukgaltawakga nema wata ktijia talatawila nema ktijia watiya takamanan ni tahan nak pukgaltawakga wama nik matlani ni tu chi xlakatakgan tuku cchi chali tuxama na taliskuja watiya talakgati talatapuli ktijia, talatapuli pala na ma tawa xa xhun xa kguchu wama ni wali tlan tu anan.
Nama tawa chu  wanikan litlawakan salchicha, jamón, nama chu xtilan kamakgastakkan xa lakapala, na chuna paxni,  tamakgnin, chu kgama wanika kamakgastakkan   ju´u snun tlan, x´katsikan tas´ taka, chan ix kilhtamaku akgtum kata, kata a itat, katla xa tawa, kgama kgalhtaxtu, xakapupum. Akin chu lik´limasnitaw  ju´u, akin a´na ni lik lamanaw, a´na ni kin kamastankganitan, wa ama chu liwan xlakata ama ni klakgati akit.
Lata kiliaktsu ge ktsakatnanit akit kintakam xkgamanamanaw akit takgasli akgtun lichukun mat xkgamanamanaw  chi akit chi kuani akit kaman chukuniyan min chixit kalhtiya chi kilichukun tsukulh kchukuni, kchukuni akgputokgo ktlawanikgolh ixchixit chu kinkajchilhkan kintse, kinanapan  tsukulh kinkakgawanikanan wana chi ama xikakchukunit kintakam.
Akit klakgati akxila pukgaman achu likgamanankan tankgololo likgaman lisnokkan kimakankan lisnonkan chumakankan talhman  katajulh nak xastiliki wa ama klakgati akxila.
Nitu takgaxmati

Campos

Cada fila de un archivo tsv representa un solo clip de audio, y contiene la siguiente información:

client_id - UUID hasheado de cierto usuario
audio_id - id numérico para archivo de audio
audio_file - nombre del archivo de audio
duration_ms - duración del audio en milisegundo
prompt_id - id numérico para el prompt
prompt - pregunta para el usuario
transcription - transcripción de la respuesta al audio
votes - número de personas quiene aprobaron cierta transcripción
age - edad de los hablantes1
gender - genero de los hablantes1
language - nombre de la lengua
split - para el modelado de datos, indica a qué subconjunto de datos pertenece este clip
char_per_sec - cuántos caracteres de transcripción por segundo de audio.
quality_tags - una evaluación automatizada del par transcripción-audio, separadas por |
- transcription-length - caracteres por segundo inferior a 3 caracteres por segundo
- speech-rate - tasa de caracteres por segundo superior a 30 caracteres por segundo
- short-audio - duración del audio inferior a 2 segundos
- long-audio - duración del audio superior a 30 segundos

Enlaces comunitarios

Traductores de Common Voice en Pontoon

Contribuir

Licencia

Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.

Footnotes

Para una lista completa de opciones de edades, generos, y acéntos, ver la especificación demográfica. Esta será reportada únicamente si el hablante aceptó proporcionar dicha información. ↩ ↩2