top of page

Preprocessing Unstructured Data for LLM Applications

Deepelearning.AI

Forbedre RAG-systemet ditt for å hente ulike datatyper

Lær å trekke ut og normalisere innhold fra en rekke ulike dokumenttyper, for eksempel PDF-filer, PowerPoints, Word- og HTML-filer, tabeller og bilder, for å utvide informasjonen som er tilgjengelig for LLM. Berik innholdet ditt med metadata, noe som forbedrer RAG-resultatene (Retrieval Augmented Generation) og støtter mer nyanserte søkemuligheter. Utforsk teknikker for dokumentbildeanalyse, for eksempel layoutdeteksjon og visjon og tabelltransformatorer, og lær å bruke disse metodene til å forbehandle PDF-filer, bilder og tabeller.

Forbedre RAG-systemet slik at det kan hente ut ulike typer data

  • Lær hvordan du trekker ut og normaliserer innhold fra en rekke ulike dokumenttyper, for eksempel PDF-filer, PowerPoints, Word- og HTML-filer, tabeller og bilder, for å utvide informasjonen som er tilgjengelig for LLM.

  • Berik innholdet med metadata, noe som forbedrer RAG-resultatene (retrieval augmented generation) og støtter mer nyanserte søkefunksjoner.

  • Utforsk teknikker for dokumentbildeanalyse, som deteksjon av layout og syns- og tabelltransformatorer, og lær hvordan du kan bruke disse metodene til å forbehandle PDF-filer, bilder og tabeller.


Dette initiativet støttes av følgende organisasjoner:

  • Twitter
  • LinkedIn
  • YouTube
logo_edited.png
bottom of page