
Preprocessing Unstructured Data for LLM Applications
Deepelearning.AI
Forbedre RAG-systemet ditt for å hente ulike datatyper
Lær å trekke ut og normalisere innhold fra en rekke ulike dokumenttyper, for eksempel PDF-filer, PowerPoints, Word- og HTML-filer, tabeller og bilder, for å utvide informasjonen som er tilgjengelig for LLM. Berik innholdet ditt med metadata, noe som forbedrer RAG-resultatene (Retrieval Augmented Generation) og støtter mer nyanserte søkemuligheter. Utforsk teknikker for dokumentbildeanalyse, for eksempel layoutdeteksjon og visjon og tabelltransformatorer, og lær å bruke disse metodene til å forbehandle PDF-filer, bilder og tabeller.
Forbedre RAG-systemet slik at det kan hente ut ulike typer data
Lær hvordan du trekker ut og normaliserer innhold fra en rekke ulike dokumenttyper, for eksempel PDF-filer, PowerPoints, Word- og HTML-filer, tabeller og bilder, for å utvide informasjonen som er tilgjengelig for LLM.
Berik innholdet med metadata, noe som forbedrer RAG-resultatene (retrieval augmented generation) og støtter mer nyanserte søkefunksjoner.
Utforsk teknikker for dokumentbildeanalyse, som deteksjon av layout og syns- og tabelltransformatorer, og lær hvordan du kan bruke disse metodene til å forbehandle PDF-filer, bilder og tabeller.