Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
teknopedia

teknopedia

teknopedia

teknopedia

teknopedia

teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Apache OpenNLP - Teknopedia
Apache OpenNLP - Teknopedia
Niente fonti!
Questa voce o sezione sull'argomento software non cita le fonti necessarie o quelle presenti sono insufficienti.

Puoi migliorare questa voce aggiungendo citazioni da fonti attendibili secondo le linee guida sull'uso delle fonti. Segui i suggerimenti del progetto di riferimento.
Apache OpenNLP
software
Logo
Logo
GenereElaborazione del linguaggio naturale
SviluppatoreApache Software Foundation
Data prima versione19 Luglio 2004; 20 anni fa
Ultima versione2.5.7 (11 dicembre 2025)
Sistema operativo
LinguaggioJava
Licenzalicenza Apache 2.0
(licenza libera)
Sito webopennlp.apache.org
Modifica dati su Wikidata · Manuale

Apache OpenNLP è un toolkit che sfrutta l'apprendimento automatico per l'elaborazione dei testi in linguaggio naturale. Supporta i compiti più comuni in ambito NLP, come il rilevamento della lingua, la tokenizzazione, la sentence segmentazione, l'etichettatura delle parti del discorso, la named entity extraction, il chunking, il parsing e la coreference resolution. Questo genere di compiti sono solitamente necessari per sviluppare servizi di elaborazione testuale più avanzati.

La libreria è scritta in Java e può essere facilmente integrata in progetti Java o in progetti che utilizzano la Java Virtual Machine (JVM).[1]

Dettagli

[modifica | modifica wikitesto]
  • Identificazione della lingua: il “LanguageDetector” richiede un modello addestrato. OpenNLP stesso offre il modello completamente addestrato langdetect-183.bin come download. Questo è in grado di identificare 103 lingue.[2]
  • Riconoscimento delle frasi: il “SentenceDetector” riconosce se un punto fermo segna la fine di una frase o se ha un significato diverso. Anche in questo caso è necessaria la specifica di un modello addestrato. OpenNLP fornisce modelli per varie lingue, ad esempio opennlp-it-ud-vit-sentence-1.3-2.5.4.bin per il riconoscimento delle frasi nei testi italiani.[3]
  • Tokenizzazione: il tokenizer divide una stringa di caratteri in token. I token sono solitamente parole, segni di punteggiatura, numeri, ecc.
  • Etichettatura part-of-speech: OpenNLP dispone di una selezione di modelli pre-addestrati per 36 lingue (tedesco, inglese, spagnolo, portoghese, danese, ecc.). Questi modelli possono essere utilizzati per etichettare automaticamente un corpus di testo in una di queste lingue.[4]
  • Estrazione di entità denominate: Il “TokenNameFinder” può riconoscere le entità denominate e i numeri nel testo. Per riconoscere le entità è necessario un modello. Il modello dipende dalla lingua e dal tipo di entità per cui è stato addestrato. Il progetto OpenNLP offre una gamma di modelli pre-addestrati che sono stati addestrati su vari corpora liberamente disponibili. Possono essere scaricati dalla pagina di download dei modelli.

Note

[modifica | modifica wikitesto]
  1. ^ Apache OpenNLP - Building from Source, su opennlp.apache.org.
  2. ^ Modello di rilevamento delle lingue di Apache OpenNLP, su opennlp.apache.org.
  3. ^ Modelli di rilevamento delle frasi di Apache OpenNLP, su opennlp.apache.org.
  4. ^ Apache Stanbol - OpenNLP POS Tagging Engine, su stanbol.apache.org.

Voci correlate

[modifica | modifica wikitesto]
  • Apache UIMA (Unstructured Information Management Architecture)
  • Apache Software Foundation
  • Licenza Apache

Collegamenti esterni

[modifica | modifica wikitesto]
  • Sito ufficiale, su opennlp.apache.org. Modifica su Wikidata
  • (EN) Apache OpenNLP, su GitHub. Modifica su Wikidata
  • Repository sorgenti di Apache OpenNLP, su github.com. Modifica su Wikidata
  • Sito di segnalazione bug, su issues.apache.org. Modifica su Wikidata
V · D · M
Apache Software Foundation
Progetti principaliAccumulo · ActiveMQ · Ambari · Ant · Aries · Apache HTTP Server · APR · Avro · Axis · Axis2 · Beam · Bloodhound · Brooklyn · Buildr · Calcite · Camel · Cassandra · Cayenne · Chemistry · CloudStack · Cocoon · Cordova · CouchDB · cTAKES · CXF · Derby · Directory · Drill · Empire-db · Felix · Flex · Flink · Flume · Geronimo · Gora · Gump · Hadoop · HBase · Hive · Jackrabbit · James · Jini · JMeter · Kafka · Kudu · Kylin · Lucene · Mahout · Maven · MINA · mod_perl · MyFaces · NetBeans · Nutch · OFBiz · Oozie · OpenEJB · OpenJPA · OpenNLP · OpenOffice · PDFBox · Parquet · Phoenix · POI · Pig · Pivot · Qpid · Roller · Samza · ServiceMix · Shiro · Sling · Solr · Spark · Stanbol · Storm · SpamAssassin · Struts 1 · Struts 2 · Subversion · SystemML · Tapestry · Thrift · Tika · Tomcat · Traffic Server · UIMA · Velocity · Wicket · Xalan · Xerces · ZooKeeperASF logo
Apache CommonsBCEL · BSF · Daemon · Jelly · Logging
Apache IncubatorNuttX · SINGA · Trafodion · XAP
Altri progettiBatik · Chainsaw · FOP · Ivy · Log4j
Apache AtticAbdera · Apex · AxKit · Beehive · Bluesky · iBATIS · Cactus · Click · Continuum · Deltacloud · Excalibur · Forrest · Hama · Harmony · HiveMind · Jakarta · Lenya · Marmotta · ODE · Shale · Shindig · Slide · Sqoop · stdcxx · Tuscany · Wave · Wink · XMLBeans
LicenzeLicenza Apache
Categoria
  Portale Informatica: accedi alle voci di Teknopedia che trattano di informatica
Estratto da "https://it.wikipedia.org/w/index.php?title=Apache_OpenNLP&oldid=145488356"

  • Indonesia
  • English
  • Français
  • 日本語
  • Deutsch
  • Italiano
  • Español
  • Русский
  • فارسی
  • Polski
  • 中文
  • Nederlands
  • Português
  • العربية
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022