Kako se imenuje zbirka pisnih besedil?
Zbirko pisnih besedil imenujemo korpus. Korpus je lahko poljubne velikosti, od majhne zbirke dokumentov do velike podatkovne baze z milijoni besedil. Korpusi se pogosto uporabljajo za lingvistične raziskave, kot je preučevanje pogostosti besed ali strukture stavkov. Uporabljajo se lahko tudi za druge namene, kot je ustvarjanje jezikovnih modelov ali usposabljanje algoritmov strojnega učenja.