Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
teknopedia

teknopedia

teknopedia

teknopedia

teknopedia

teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Apache_OpenNLP
Apache_OpenNLP
Apache OpenNLP - Teknopedia
Vai al contenuto
Menu principale
Navigazione
  • Pagina principale
  • Ultime modifiche
  • Una voce a caso
  • Nelle vicinanze
  • Vetrina
  • Aiuto
  • Sportello informazioni
  • Pagine speciali
Comunità
  • Portale Comunità
  • Bar
  • Il Teknopediano
  • Contatti
Teknopedia L'enciclopedia libera
Ricerca
  • Fai una donazione
  • registrati
  • entra
  • Fai una donazione
  • registrati
  • entra

Indice

  • Inizio
  • 1 Dettagli
  • 2 Note
  • 3 Voci correlate
  • 4 Collegamenti esterni

Apache OpenNLP

  • Català
  • Dansk
  • Deutsch
  • English
  • Español
  • Français
  • 日本語
  • Norsk bokmål
  • Português
  • Русский
  • Svenska
  • Українська
  • 中文
Modifica collegamenti
  • Voce
  • Discussione
  • Leggi
  • Modifica
  • Modifica wikitesto
  • Cronologia
Strumenti
Azioni
  • Leggi
  • Modifica
  • Modifica wikitesto
  • Cronologia
Generale
  • Puntano qui
  • Modifiche correlate
  • Link permanente
  • Informazioni pagina
  • Cita questa voce
  • Ottieni URL breve
  • Scarica codice QR
Stampa/esporta
  • Crea un libro
  • Scarica come PDF
  • Versione stampabile
In altri progetti
  • Elemento Wikidata
Aspetto
Da Teknopedia, l'enciclopedia libera.
Niente fonti!
Questa voce o sezione sull'argomento software non cita le fonti necessarie o quelle presenti sono insufficienti.

Puoi migliorare questa voce aggiungendo citazioni da fonti attendibili secondo le linee guida sull'uso delle fonti. Segui i suggerimenti del progetto di riferimento.
Apache OpenNLP
software
Logo
Logo
GenereElaborazione del linguaggio naturale
SviluppatoreApache Software Foundation
Data prima versione19 Luglio 2004; 20 anni fa
Ultima versione2.5.7 (11 dicembre 2025)
Sistema operativo
LinguaggioJava
Licenzalicenza Apache 2.0
(licenza libera)
Sito webopennlp.apache.org
Modifica dati su Wikidata · Manuale

Apache OpenNLP è un toolkit che sfrutta l'apprendimento automatico per l'elaborazione dei testi in linguaggio naturale. Supporta i compiti più comuni in ambito NLP, come il rilevamento della lingua, la tokenizzazione, la sentence segmentazione, l'etichettatura delle parti del discorso, la named entity extraction, il chunking, il parsing e la coreference resolution. Questo genere di compiti sono solitamente necessari per sviluppare servizi di elaborazione testuale più avanzati.

La libreria è scritta in Java e può essere facilmente integrata in progetti Java o in progetti che utilizzano la Java Virtual Machine (JVM).[1]

Dettagli

[modifica | modifica wikitesto]
  • Identificazione della lingua: il “LanguageDetector” richiede un modello addestrato. OpenNLP stesso offre il modello completamente addestrato langdetect-183.bin come download. Questo è in grado di identificare 103 lingue.[2]
  • Riconoscimento delle frasi: il “SentenceDetector” riconosce se un punto fermo segna la fine di una frase o se ha un significato diverso. Anche in questo caso è necessaria la specifica di un modello addestrato. OpenNLP fornisce modelli per varie lingue, ad esempio opennlp-it-ud-vit-sentence-1.3-2.5.4.bin per il riconoscimento delle frasi nei testi italiani.[3]
  • Tokenizzazione: il tokenizer divide una stringa di caratteri in token. I token sono solitamente parole, segni di punteggiatura, numeri, ecc.
  • Etichettatura part-of-speech: OpenNLP dispone di una selezione di modelli pre-addestrati per 36 lingue (tedesco, inglese, spagnolo, portoghese, danese, ecc.). Questi modelli possono essere utilizzati per etichettare automaticamente un corpus di testo in una di queste lingue.[4]
  • Estrazione di entità denominate: Il “TokenNameFinder” può riconoscere le entità denominate e i numeri nel testo. Per riconoscere le entità è necessario un modello. Il modello dipende dalla lingua e dal tipo di entità per cui è stato addestrato. Il progetto OpenNLP offre una gamma di modelli pre-addestrati che sono stati addestrati su vari corpora liberamente disponibili. Possono essere scaricati dalla pagina di download dei modelli.

Note

[modifica | modifica wikitesto]
  1. ^ Apache OpenNLP - Building from Source, su opennlp.apache.org.
  2. ^ Modello di rilevamento delle lingue di Apache OpenNLP, su opennlp.apache.org.
  3. ^ Modelli di rilevamento delle frasi di Apache OpenNLP, su opennlp.apache.org.
  4. ^ Apache Stanbol - OpenNLP POS Tagging Engine, su stanbol.apache.org.

Voci correlate

[modifica | modifica wikitesto]
  • Apache UIMA (Unstructured Information Management Architecture)
  • Apache Software Foundation
  • Licenza Apache

Collegamenti esterni

[modifica | modifica wikitesto]
  • Sito ufficiale, su opennlp.apache.org. Modifica su Wikidata
  • (EN) Apache OpenNLP, su GitHub. Modifica su Wikidata
  • Repository sorgenti di Apache OpenNLP, su github.com. Modifica su Wikidata
  • Sito di segnalazione bug, su issues.apache.org. Modifica su Wikidata
V · D · M
Apache Software Foundation
Progetti principaliAccumulo · ActiveMQ · Ambari · Ant · Aries · Apache HTTP Server · APR · Avro · Axis · Axis2 · Beam · Bloodhound · Brooklyn · Buildr · Calcite · Camel · Cassandra · Cayenne · Chemistry · CloudStack · Cocoon · Cordova · CouchDB · cTAKES · CXF · Derby · Directory · Drill · Empire-db · Felix · Flex · Flink · Flume · Geronimo · Gora · Gump · Hadoop · HBase · Hive · Jackrabbit · James · Jini · JMeter · Kafka · Kudu · Kylin · Lucene · Mahout · Maven · MINA · mod_perl · MyFaces · NetBeans · Nutch · OFBiz · Oozie · OpenEJB · OpenJPA · OpenNLP · OpenOffice · PDFBox · Parquet · Phoenix · POI · Pig · Pivot · Qpid · Roller · Samza · ServiceMix · Shiro · Sling · Solr · Spark · Stanbol · Storm · SpamAssassin · Struts 1 · Struts 2 · Subversion · SystemML · Tapestry · Thrift · Tika · Tomcat · Traffic Server · UIMA · Velocity · Wicket · Xalan · Xerces · ZooKeeperASF logo
Apache CommonsBCEL · BSF · Daemon · Jelly · Logging
Apache IncubatorNuttX · SINGA · Trafodion · XAP
Altri progettiBatik · Chainsaw · FOP · Ivy · Log4j
Apache AtticAbdera · Apex · AxKit · Beehive · Bluesky · iBATIS · Cactus · Click · Continuum · Deltacloud · Excalibur · Forrest · Hama · Harmony · HiveMind · Jakarta · Lenya · Marmotta · ODE · Shale · Shindig · Slide · Sqoop · stdcxx · Tuscany · Wave · Wink · XMLBeans
LicenzeLicenza Apache
Categoria
  Portale Informatica: accedi alle voci di Teknopedia che trattano di informatica
Estratto da "https://it.wikipedia.org/w/index.php?title=Apache_OpenNLP&oldid=145488356"
Categorie:
  • Elaboratori di linguaggio naturale liberi
  • Software libero in Java
  • Software con licenza Apache
  • Software del 2004
  • Software multipiattaforma
  • Librerie Java
  • Elaborazione del linguaggio naturale
Categorie nascoste:
  • Senza fonti - software
  • Senza fonti - ottobre 2024
  • Software senza sistema operativo
  • P277 differente su Wikidata
  • P571 differente su Wikidata
  • P154 letta da Wikidata
  • P348 letta da Wikidata
  • P856 differente su Wikidata
  • P856 letta da Wikidata
  • P2037 letta da Wikidata
  • Voci con template Collegamenti esterni e qualificatori sconosciuti
  • P1324 letta da Wikidata
  • P1401 letta da Wikidata
  • Questa pagina è stata modificata per l'ultima volta il 17 giu 2025 alle 17:47.
  • Il testo è disponibile secondo la licenza Creative Commons Attribuzione-Condividi allo stesso modo; possono applicarsi condizioni ulteriori. Vedi le condizioni d'uso per i dettagli.
  • Informativa sulla privacy
  • Informazioni su Teknopedia
  • Avvertenze
  • Contatti legali e di sicurezza
  • Codice di condotta
  • Sviluppatori
  • Statistiche
  • Dichiarazione sui cookie
  • Versione mobile
  • Wikimedia Foundation
  • Powered by MediaWiki
Apache OpenNLP
Aggiungi argomento

  • Indonesia
  • English
  • Français
  • 日本語
  • Deutsch
  • Italiano
  • Español
  • Русский
  • فارسی
  • Polski
  • 中文
  • Nederlands
  • Português
  • العربية
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022