Edición de texto en Chat GPT: formatos, límites y posibilidades



A menudo nos zambullimos en Chat GPT como si no tuviera límites de uso ni criterios de calidad en el procesado de los contenidos. Resumo aquí algunas características que hay que tener en cuenta cuando manejamos texto en Chat GPT.


Características de formatos admitidos por Chat GPT

  • Markdown (.md): Ideal para texto limpio y estructurado, para el docente o estudiante que desee manejar un volumen considerable de datos.

  • Texto plano (.txt): Ligero y simple. Igualmente recomendable para grandes cantidades de datos. 

  • Word (.docx): Compatible con documentos de texto ricos, aunque si añades complejidad puede ser un problema a la hora de que te reconozca determinados elementos.

  • PDF (.pdf): Excelente para documentos finales, aunque pueden surgir problemas con PDFs escaneados o protegidos.

  • CSV (.csv): útil para datos en tablas.


Comparativa por formato

Formato

Ventajas

Desventajas

Ejemplo

Markdown

Estructura clara, ligero, rápido de procesar. Ideal para grandes cantidades de datos.

Necesita conocimientos básicos de sintaxis Markdown, aunque existen conversores. No admite formatos complejos (imágenes, gráficas...)

Notas rápidas o documentación técnica con secciones claras y listas.

TXT

Simple, ideal para textos sin formato.

No admite tablas ni estilos enriquecidos (encabezados, negritas, imágenes...).

Un archivo de texto básico con listas de vocabulario o tareas.

DOCX

Versatilidad en estilo y formato.

Archivos muy complejos pueden ser difíciles de interpretar.

Un ensayo académico con encabezados, negritas y tablas simples.

PDF

Ideal para compartir documentos finales.

Los PDFs escaneados o protegidos pueden ser imposibles de procesar.

Un informe empresarial con texto accesible y tablas explicativas.

CSV

Perfecto para datos estructurados.

Difícil de interpretar si contiene celdas complejas o datos mal formateados.

Una lista de estudiantes con nombres, notas y asistencias en formato tabular.


Límites en el procesado de documentos

Límites

Gratuita

Plus

Límite de tokens

4,096 tokens

32,000 tokens

Equivalente en palabras

~3,000 palabras

~25,000 palabras

Equivalente en páginas

~10 páginas

~70 páginas

Número de archivos

Hasta 10

Hasta 10

Tamaño total

50 MB

50 MB


Si los documentos exceden el límite de tokens, solo se procesará una parte.

Ventajas y limitaciones por formato

  • Markdown y TXT: Procesamiento rápido y eficiente debido a su simplicidad. No interpreta documentos complejos (gráficos, imágenes incrustadas, tablas densas).

  • Word y PDF: Permiten trabajar con documentos enriquecidos y visualmente estructurados. PDFs escaneados requieren software OCR previo. No procesa bien imágenes y gráficas, aunque los modelos están mejorando.

  • CSV: Excelente para tareas de datos y cálculos simples. No procesa contenido visual (imágenes, videos), solo texto accesible.


Tabla comparativa por modalidad de uso

Modelo

Límite de tokens

Número de archivos

Tamaño por archivo

Capacidades especiales

GPT-4o

4,096 tokens (gratuita)

Hasta 10 archivos

50 MB

Procesa texto plano y archivos básicos; menos memoria contextual.

GPT-o1

32,000 tokens (Plus)

Hasta 10 archivos

50 MB

Ideal para procesamiento extenso; mantiene más contexto.

Modo lienzo (GPT-o1)

32,000 tokens

Hasta 10 archivos

50 MB

Permite trabajar colaborativamente con ediciones en tiempo real.

Asistente personalizado (GPT-o1)

Configurable hasta 32,000

Depende de la configuración

50 MB

Personalizable para tareas específicas y con opciones multimodales.


Consejos

  1. Selecciona el formato correcto:

    • Usa Markdown o TXT para textos largos y estructurados.

    • Opta por Word o PDF para documentos enriquecidos.

  2. Divide documentos extensos:

    • Si el contenido es muy extenso: Divídelo en secciones lógicas como capítulos, apartados o temas clave. Por ejemplo, si tienes un informe de 50 páginas, separa primero el resumen y luego los apartados principales.

    • Para informes largos: Usa herramientas para cortar el documento en fragmentos más pequeños y prioriza las secciones esenciales. Por ejemplo, carga primero las conclusiones o las partes críticas.

    • Etiquetado claro: Nombra cada sección de forma identificable, como "Parte 1: Introducción" o "Capítulo 2: Análisis", para mantener el orden en el procesamiento.

    • Prioriza lo relevante: Si hay un límite de tokens, selecciona las secciones que más valor aporten en ese momento, como tablas de resultados o resúmenes.

  3. Evita contenido visual complejo:

    • Si el documento incluye gráficos, imágenes o diagramas, acompáñalos con descripciones textuales claras para que ChatGPT pueda interpretarlos correctamente.

    • En lugar de cargar imágenes directamente, considera convertir sus datos en texto o tablas que sean más fáciles de analizar. 

    • Para tablas complejas, simplifica las celdas y asegúrate de que estén organizadas en filas y columnas coherentes.

    • Evita usar elementos visuales decorativos que no aporten información relevante al texto procesado.

    • Ejemplo: Si tienes un gráfico de barras con resultados de encuestas, incluye una lista con los datos numéricos y etiquetas explicativas de cada barra.

    • Describe gráficos o diagramas en texto si el formato incluye elementos visuales importantes.

    • El análisis visual puedes hacerlo con el modo visión que ya ofrece gratuitamente Google AI Studio y en breve lo hará Chat GPT en Europa. Estos modelos de lectura y visión es previsible que en uno o dos años se integren en una misma interfaz  multimodal y se puedan trabajar a la vez.

  4. Optimiza PDFs:

    • Asegúrate de que el contenido del PDF sea texto accesible, sin imágenes escaneadas. Si el PDF contiene imágenes, utiliza software OCR (Reconocimiento Óptico de Caracteres) para convertirlo en texto antes de procesarlo.

    • Revisa que el documento no tenga protecciones o restricciones que puedan impedir su lectura.

    • Divide el contenido del PDF en secciones si es extenso, para ajustarlo al límite de tokens procesables.

    • Evita cargar PDFs con gráficos complejos o diagramas que no estén acompañados de descripciones textuales claras.

    • Por ejemplo, si estás procesando un PDF con tablas financieras, convierte las tablas en texto estructurado para facilitar su análisis. de que sean textuales, no escaneados.

  5. Revisa la estructura:

    • Usa títulos claros y jerarquizados (por ejemplo, encabezados con #, ##, ### en Markdown o estilos en Word) para facilitar el análisis.

    • Divide el contenido en párrafos cortos y secciones bien delimitadas para una mejor legibilidad.

    • Utiliza listas numeradas o con viñetas para presentar información en bloques claros.

    • Incluye tablas simples con columnas bien definidas y evita el uso de formatos visuales complejos.

    • Evita agregar elementos como imágenes o gráficos incrustados si no son estrictamente necesarios. Si son imprescindibles, describe su contenido en texto claro. Usa títulos claros, listas y tablas simples para facilitar el análisis.

  6. Proporciona contexto:

    • Explica brevemente el propósito del documento antes de procesarlo. Por ejemplo, indica si buscas un resumen, un análisis, una extracción de datos o una evaluación de contenido.

    • Si el documento tiene elementos visuales o contextuales importantes, describe cómo se relacionan con la información textual para dar más contexto.

    • Incluye detalles clave, como el enfoque deseado o las secciones prioritarias, para orientar mejor el procesamiento.

    • Para tareas extensas, especifica los objetivos principales para evitar información redundante o irrelevante. Acompaña los documentos con una explicación breve del objetivo (resumen, análisis, extracción de datos, etc.).

  7. Prueba antes:

    • Revisa el contenido en un editor de texto para asegurarte de que sea accesible y claro.


Cómo editar con Markdown

  1. Usa encabezados claros:

    • Utiliza # para encabezados principales, ## para subtítulos y ### para secciones más específicas.

    • Ejemplo:

      # Encabezado Principal
      ## Subtítulo
      ### Sección Detallada
  2. Crea listas ordenadas y desordenadas:

    • Usa - o * para listas desordenadas y números para listas ordenadas.

    • Ejemplo:

      - Elemento 1
      - Elemento 2
      1. Primer paso
      2. Segundo paso
  3. Añade enlaces y formato básico:

    • Para negritas, usa **texto**. Para cursivas, usa *texto*. Para enlaces, sigue este formato:

      [Texto del Enlace](URL)
  4. Incluye tablas simples:

    • Usa el formato de barras verticales (|) y guiones (-).

    • Ejemplo:

      | Columna 1 | Columna 2 |
      |-----------|-----------|
      | Dato 1    | Dato 2    |


Aplicaciones para conversión a Markdown

Si tienes contenido en otros formatos, estas herramientas te ayudarán a convertirlo a Markdown:

  • Microsoft MarkItDown: Subes el archivo a convertir y listo. Soporta los formatos PDF, PPTX, DOCX, XLSX, HTML... y también imágenes (escaneado de textos) y audios (transcripciones).

  • Pandoc: Una herramienta versátil para convertir documentos entre múltiples formatos (Word, HTML, PDF a Markdown).

  • Dillinger: Un editor online para crear y convertir contenido a Markdown fácilmente.

  • Typora: Un editor de Markdown con vista previa en tiempo real.


Limitaciones de conversión a Markdown

  1. Complejidad del formato de origen: Documentos con gráficos, imágenes o tablas avanzadas pueden no convertirse correctamente a Markdown.

  2. Pérdida de estilos visuales: Los formatos como colores, fuentes o diagramas no se traducen a Markdown y deben adaptarse manualmente.

  3. Errores en tablas o listas grandes: Contenido con muchas celdas o listas anidadas puede requerir ajustes posteriores para mantener la claridad.


Capacidades multimodales y futuras aplicaciones

Chat GPT ha comenzado a integrar capacidades multimodales (en Europa aún no ha llegado), lo que abre nuevas posibilidades para su uso educativo y profesional. Estas capacidades no solo se limitan al texto, sino que también abarcan la interpretación de imágenes, gráficos y otros elementos visuales. El modo visión será sin duda un campo abonado a múltiples posibilidades. Podéis probarlo ya en Google AI Studio.

  • Reconocimiento de patrones visuales: La IA podría detectar y analizar patrones complejos en imágenes, como mapas históricos o gráficos científicos. Por ejemplo, en historia, identificar relaciones en mapas geopolíticos antiguos.

  • Análisis de vídeos: Una futura integración permitiría interpretar contenido de vídeo, como analizar experimentos grabados en clases de ciencias o detectar movimientos en lecciones de educación física para evaluar técnicas deportivas.

  • Interacción multimodal completa: Una combinación fluida de texto, imágenes y voz transformaría el aprendizaje. Por ejemplo, al analizar una pintura en clases de arte, la IA podría proporcionar datos históricos mientras describe los elementos visuales.

Estas capacidades multimodales complementan las funciones textuales actuales, ampliando el alcance de Chat GPT como herramienta de aprendizaje. Por ejemplo, un docente de ciencias puede cargar imágenes de experimentos para que la IA explique los resultados, mientras que en artes visuales se podrían analizar obras y estilos artísticos.

En un artículo posterior, hablaré de esto. Cómo el modo visión puede ayudar a estudiantes y docentes.


Comentarios