<?xml version="1.0" encoding="UTF-8" ?>
<oai_dc:dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2008/02/11/dc.xsd">
<dc:publisher>HAL CCSD</dc:publisher>
<dc:title lang="en">A Preliminary Study for Building the Basque PropBank</dc:title>
<dc:creator>Agirre, Eneko, E.</dc:creator>
<dc:creator>Aldezabal, Izaskun</dc:creator>
<dc:creator>Etxeberria, Jone</dc:creator>
<dc:creator>Pociello, Eli</dc:creator>
<dc:contributor>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) ; University of the Basque Country = Euskal Herriko Unibertsitatea (UPV / EHU)</dc:contributor>
<dc:source>Proceedings of the 5th International Conference on Language Resources and Evaluations (LREC)</dc:source>
<dc:identifier>artxibo-00000094</dc:identifier>
<dc:identifier>https://artxiker.ccsd.cnrs.fr/artxibo-00000094</dc:identifier>
<dc:identifier>https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2/document</dc:identifier>
<dc:identifier>https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2/file/Basque_PropBank.pdf</dc:identifier>
<dc:source>https://artxiker.ccsd.cnrs.fr/artxibo-00000094</dc:source>
<dc:language>en</dc:language>
<dc:subject lang="fr">semantic annotation</dc:subject>
<dc:subject lang="fr">semantic roles</dc:subject>
<dc:subject lang="fr">PropBank</dc:subject>
<dc:subject lang="fr">Basque PropBank</dc:subject>
<dc:subject>[SHS.LANGUE.TRAI.LEXI]Humanities and Social Sciences/Linguistics/domain_shs.langue.trai/domain_shs.langue.trai.lexi</dc:subject>
<dc:subject>[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]</dc:subject>
<dc:subject>[SHS.LANGUE.TRAI.RESS]Humanities and Social Sciences/Linguistics/domain_shs.langue.trai/domain_shs.langue.trai.ress</dc:subject>
<dc:type>info:eu-repo/semantics/conferenceObject</dc:type>
<dc:type>Conference papers</dc:type>
<dc:description lang="en">This paper presents a methodology for adding a layer of semantic annotation to a syntactically annotated corpus of Basque (EPEC), in terms of semantic roles. The proposal we make here is the combination of three resources: the model used in the PropBank project (Palmer et al., 2005), an in-house database with syntactic/semantic subcategorization frames for Basque verbs (Aldezabal, 2004) and the Basque dependency treebank (Aduriz et al., 2003). In order to validate the methodology and to confirm whether the PropBank model is suitable for Basque and our treebank design, we have built lexical entries and labelled all argument and adjuncts occurring in our treebank for 3 Basque verbs. The result of this study has been very positive, and has produced a methodology adapted to the characteristics of the language and the Basque dependency treebank. Another goal of this study was to study whether semi-automatic tagging was possible. The idea is to present the human taggers a pre-tagged version of the corpus. We have seen that many arguments could be automatically tagged with high precision, given only the verbal entries for the verbs and a handful of examples.</dc:description>
<dc:date>2006-06-22</dc:date>
<dc:rights>info:eu-repo/semantics/OpenAccess</dc:rights>
</oai_dc:dc>
<?xml version="1.0" encoding="UTF-8" ?>
<oai_dcterms:dcterms>
<dcterms:identifier>artxibo-00000094</dcterms:identifier>
<dcterms:identifier>https://artxiker.ccsd.cnrs.fr/artxibo-00000094</dcterms:identifier>
<dcterms:identifier>https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2/document</dcterms:identifier>
<dcterms:identifier>https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2/file/Basque_PropBank.pdf</dcterms:identifier>
<dcterms:isPartOf>[SHS] Sciences de l'Homme et de la Société</dcterms:isPartOf>
<dcterms:isPartOf>[AO-LINGUISTIQUE] Archives ouvertes de la Linguistique</dcterms:isPartOf>
<dcterms:isPartOf>[OR-COLLCODE] Portail Artxiker</dcterms:isPartOf>
<dcterms:isPartOf>[ARTXIKER] Portail Artxiker</dcterms:isPartOf>
<dcterms:title lang="en">A Preliminary Study for Building the Basque PropBank</dcterms:title>
<dcterms:creator>Agirre, Eneko,</dcterms:creator>
<dcterms:creator>Aldezabal, Izaskun</dcterms:creator>
<dcterms:creator>Etxeberria, Jone</dcterms:creator>
<dcterms:creator>Pociello, Eli</dcterms:creator>
<dcterms:subject>[SHS.LANGUE.TRAI.LEXI] Humanities and Social Sciences/Linguistics/Automatic Processing of the Language/Lexicography-Semantics</dcterms:subject>
<dcterms:subject>[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]</dcterms:subject>
<dcterms:subject>[SHS.LANGUE.TRAI.RESS] Humanities and Social Sciences/Linguistics/Automatic Processing of the Language/Linguistic Resources (Corpuses, Glossaries, Grammars...)</dcterms:subject>
<dcterms:type>COMM</dcterms:type>
<dcterms:subject lang="fr">semantic annotation</dcterms:subject>
<dcterms:subject lang="fr">semantic roles</dcterms:subject>
<dcterms:subject lang="fr">PropBank</dcterms:subject>
<dcterms:subject lang="fr">Basque PropBank</dcterms:subject>
<dcterms:abstract lang="en">This paper presents a methodology for adding a layer of semantic annotation to a syntactically annotated corpus of Basque (EPEC), in terms of semantic roles. The proposal we make here is the combination of three resources: the model used in the PropBank project (Palmer et al., 2005), an in-house database with syntactic/semantic subcategorization frames for Basque verbs (Aldezabal, 2004) and the Basque dependency treebank (Aduriz et al., 2003). In order to validate the methodology and to confirm whether the PropBank model is suitable for Basque and our treebank design, we have built lexical entries and labelled all argument and adjuncts occurring in our treebank for 3 Basque verbs. The result of this study has been very positive, and has produced a methodology adapted to the characteristics of the language and the Basque dependency treebank. Another goal of this study was to study whether semi-automatic tagging was possible. The idea is to present the human taggers a pre-tagged version of the corpus. We have seen that many arguments could be automatically tagged with high precision, given only the verbal entries for the verbs and a handful of examples.</dcterms:abstract>
<dcterms:created>2006-06-22</dcterms:created>
<dcterms:available>2006-06-22</dcterms:available>
<dcterms:language>en</dcterms:language>
<dcterms:source>Proceedings of the 5th International Conference on Language Resources and Evaluations (LREC)</dcterms:source>
</oai_dcterms:dcterms>
<?xml version="1.0" encoding="UTF-8" ?>
<datacite:resource schemaLocation="http://datacite.org/schema/kernel-4 https://schema.datacite.org/meta/kernel-4.4/metadata.xsd">
<datacite:identifier identifierType="URL">https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2</datacite:identifier>
<datacite:creators>
<datacite:creator>
<datacite:creatorName>Agirre, Eneko</datacite:creatorName>
<datacite:givenName>Eneko</datacite:givenName>
<datacite:familyName>Agirre</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
<datacite:creator>
<datacite:creatorName>Aldezabal, Izaskun</datacite:creatorName>
<datacite:givenName>Izaskun</datacite:givenName>
<datacite:familyName>Aldezabal</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
<datacite:creator>
<datacite:creatorName>Etxeberria, Jone</datacite:creatorName>
<datacite:givenName>Jone</datacite:givenName>
<datacite:familyName>Etxeberria</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
<datacite:creator>
<datacite:creatorName>Pociello, Eli</datacite:creatorName>
<datacite:givenName>Eli</datacite:givenName>
<datacite:familyName>Pociello</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
</datacite:creators>
<datacite:titles>
<datacite:title lang="en">A Preliminary Study for Building the Basque PropBank</datacite:title>
</datacite:titles>
<datacite:publisher>HAL CCSD</datacite:publisher>
<datacite:subjects>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">semantic annotation</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">semantic roles</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">PropBank</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">Basque PropBank</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" valueURI="SHS.LANGUE.TRAI.LEXI" lang="en">[SHS.LANGUE.TRAI.LEXI] Humanities and Social Sciences/Linguistics/Automatic Processing of the Language/Lexicography-Semantics</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" valueURI="INFO.INFO-CL" lang="en">[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" valueURI="SHS.LANGUE.TRAI.RESS" lang="en">[SHS.LANGUE.TRAI.RESS] Humanities and Social Sciences/Linguistics/Automatic Processing of the Language/Linguistic Resources (Corpuses, Glossaries, Grammars...)</datacite:subject>
</datacite:subjects>
<datacite:contributors>
<datacite:contributor contributorType="ContactPerson">
<datacite:contributorName>Aldezabal, Izaskun</datacite:contributorName>
</datacite:contributor>
</datacite:contributors>
<datacite:dates>
<datacite:date dateType="Submitted">2006-06-22 13:24:42</datacite:date>
<datacite:date dateType="Updated">2024-03-12 14:16:04</datacite:date>
<datacite:date dateType="Available">2006-06-22 13:58:20</datacite:date>
<datacite:date dateType="Issued">2006</datacite:date>
</datacite:dates>
<datacite:language>en</datacite:language>
<datacite:resourceType resourceTypeGeneral="Text">Conference papers</datacite:resourceType>
<datacite:relatedIdentifiers>
<datacite:relatedIdentifier relatedIdentifierType="URL" relationType="IsNewVersionOf">https://artxiker.ccsd.cnrs.fr/artxibo-00000094v1</datacite:relatedIdentifier>
</datacite:relatedIdentifiers>
<datacite:formats>
<datacite:format>application/pdf</datacite:format>
</datacite:formats>
<datacite:version>2</datacite:version>
<datacite:rightsList>
</datacite:rightsList>
<datacite:sizes>
<datacite:size>230.15 Ko</datacite:size>
</datacite:sizes>
<datacite:descriptions>
<datacite:description descriptionType="Abstract" lang="en">This paper presents a methodology for adding a layer of semantic annotation to a syntactically annotated corpus of Basque (EPEC), in terms of semantic roles. The proposal we make here is the combination of three resources: the model used in the PropBank project (Palmer et al., 2005), an in-house database with syntactic/semantic subcategorization frames for Basque verbs (Aldezabal, 2004) and the Basque dependency treebank (Aduriz et al., 2003). In order to validate the methodology and to confirm whether the PropBank model is suitable for Basque and our treebank design, we have built lexical entries and labelled all argument and adjuncts occurring in our treebank for 3 Basque verbs. The result of this study has been very positive, and has produced a methodology adapted to the characteristics of the language and the Basque dependency treebank. Another goal of this study was to study whether semi-automatic tagging was possible. The idea is to present the human taggers a pre-tagged version of the corpus. We have seen that many arguments could be automatically tagged with high precision, given only the verbal entries for the verbs and a handful of examples.</datacite:description>
</datacite:descriptions>
</datacite:resource>
<?xml version="1.0" encoding="UTF-8" ?>
<oaire:resource>
<datacite:titles>
<datacite:title lang="en">A Preliminary Study for Building the Basque PropBank</datacite:title>
</datacite:titles>
<datacite:creators>
<datacite:creator>
<datacite:creatorName>Agirre, Eneko</datacite:creatorName>
<datacite:givenName>Eneko</datacite:givenName>
<datacite:familyName>Agirre</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
<datacite:creator>
<datacite:creatorName>Aldezabal, Izaskun</datacite:creatorName>
<datacite:givenName>Izaskun</datacite:givenName>
<datacite:familyName>Aldezabal</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
<datacite:creator>
<datacite:creatorName>Etxeberria, Jone</datacite:creatorName>
<datacite:givenName>Jone</datacite:givenName>
<datacite:familyName>Etxeberria</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
<datacite:creator>
<datacite:creatorName>Pociello, Eli</datacite:creatorName>
<datacite:givenName>Eli</datacite:givenName>
<datacite:familyName>Pociello</datacite:familyName>
<datacite:affiliation>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia) - UPV / EHU - University of the Basque Country = Euskal Herriko Unibertsitatea</datacite:affiliation>
</datacite:creator>
</datacite:creators>
<datacite:contributors>
<datacite:contributor contributorType="ContactPerson">
<datacite:contributorName>Aldezabal, Izaskun</datacite:contributorName>
</datacite:contributor>
</datacite:contributors>
<datacite:relatedIdentifiers>
<datacite:relatedIdentifier relatedIdentifierType="URL" relationType="IsNewVersionOf">https://artxiker.ccsd.cnrs.fr/artxibo-00000094v1</datacite:relatedIdentifier>
</datacite:relatedIdentifiers>
<datacite:dates>
<datacite:date dateType="Submitted">2006-06-22 13:24:42</datacite:date>
<datacite:date dateType="Updated">2024-03-12 14:16:04</datacite:date>
<datacite:date dateType="Available">2006-06-22 13:58:20</datacite:date>
<datacite:date dateType="Issued">2006</datacite:date>
</datacite:dates>
<dc:language>en</dc:language>
<dc:description lang="en">This paper presents a methodology for adding a layer of semantic annotation to a syntactically annotated corpus of Basque (EPEC), in terms of semantic roles. The proposal we make here is the combination of three resources: the model used in the PropBank project (Palmer et al., 2005), an in-house database with syntactic/semantic subcategorization frames for Basque verbs (Aldezabal, 2004) and the Basque dependency treebank (Aduriz et al., 2003). In order to validate the methodology and to confirm whether the PropBank model is suitable for Basque and our treebank design, we have built lexical entries and labelled all argument and adjuncts occurring in our treebank for 3 Basque verbs. The result of this study has been very positive, and has produced a methodology adapted to the characteristics of the language and the Basque dependency treebank. Another goal of this study was to study whether semi-automatic tagging was possible. The idea is to present the human taggers a pre-tagged version of the corpus. We have seen that many arguments could be automatically tagged with high precision, given only the verbal entries for the verbs and a handful of examples.</dc:description>
<dc:format>application/pdf</dc:format>
<datacite:identifier identifierType="URL">https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2</datacite:identifier>
<dc:source>EISSN:</dc:source>
<dc:source>ISSN:</dc:source>
<dc:source>JName: Proceedings of the 5th International Conference on Language Resources and Evaluations (LREC)</dc:source>
<datacite:subjects>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">semantic annotation</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">semantic roles</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">PropBank</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" lang="fr">Basque PropBank</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" valueURI="SHS.LANGUE.TRAI.LEXI" lang="en">[SHS.LANGUE.TRAI.LEXI] Humanities and Social Sciences/Linguistics/domain_shs.langue.trai/domain_shs.langue.trai.lexi</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" valueURI="INFO.INFO-CL" lang="en">[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL]</datacite:subject>
<datacite:subject schemeURI="https://aurehal.archives-ouvertes.fr/domain/index" subjectScheme="HAL" valueURI="SHS.LANGUE.TRAI.RESS" lang="en">[SHS.LANGUE.TRAI.RESS] Humanities and Social Sciences/Linguistics/domain_shs.langue.trai/domain_shs.langue.trai.ress</datacite:subject>
</datacite:subjects>
<datacite:sizes>
<datacite:size>230.15 Ko</datacite:size>
</datacite:sizes>
<oaire:version>2</oaire:version>
<dcterms:audience>0</dcterms:audience>
<oaire:resourceType resourceTypeGeneral="literature" uri="http://purl.org/coar/resource_type/c_5794">conference paper</oaire:resourceType>
<datacite:rights rightsURI="http://purl.org/coar/access_right/c_abf2">open access</datacite:rights>
<oaire:file accessRightsURI="http://purl.org/coar/access_right/c_abf2" mimeType="application/pdf" objectType="fulltext">open access</oaire:file>
</oaire:resource>
<?xml version="1.0" encoding="UTF-8" ?>
<tei:TEI version="1.1" schemaLocation="http://www.tei-c.org/ns/1.0 http://api.archives-ouvertes.fr/documents/aofr-sword.xsd">
<tei:teiHeader>
<tei:fileDesc>
<tei:titleStmt>
<tei:title>HAL TEI export of artxibo-00000094v2</tei:title>
</tei:titleStmt>
<tei:publicationStmt>
<tei:distributor>CCSD</tei:distributor>
<tei:availability status="restricted">
<tei:licence target="http://creativecommons.org/licenses/by/4.0/">Distributed under a Creative Commons Attribution 4.0 International License</tei:licence>
</tei:availability>
</tei:publicationStmt>
<tei:sourceDesc>
<tei:p part="N">HAL API platform</tei:p>
</tei:sourceDesc>
</tei:fileDesc>
</tei:teiHeader>
<tei:text>
<tei:body>
<tei:listBibl>
<tei:biblFull>
<tei:titleStmt>
<tei:title lang="en">A Preliminary Study for Building the Basque PropBank</tei:title>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Eneko</tei:forename>
<tei:forename type="middle">E.</tei:forename>
<tei:surname>Agirre</tei:surname>
</tei:persName>
<tei:idno type="halauthorid">149946-0</tei:idno>
</tei:author>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Izaskun</tei:forename>
<tei:surname>Aldezabal</tei:surname>
</tei:persName>
<tei:email type="md5">367c233f0cb8a90cf53ae24e9d026e9c</tei:email>
<tei:email type="domain">ehu.es</tei:email>
<tei:idno notation="numeric" type="idhal">832964</tei:idno>
<tei:idno notation="string" type="halauthorid">136571-832964</tei:idno>
</tei:author>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Jone</tei:forename>
<tei:surname>Etxeberria</tei:surname>
</tei:persName>
<tei:idno type="halauthorid">136572-0</tei:idno>
</tei:author>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Eli</tei:forename>
<tei:surname>Pociello</tei:surname>
</tei:persName>
<tei:idno type="halauthorid">136573-0</tei:idno>
</tei:author>
<tei:editor role="depositor">
<tei:persName>
<tei:forename>Izaskun</tei:forename>
<tei:surname>Aldezabal</tei:surname>
</tei:persName>
<tei:email type="md5">367c233f0cb8a90cf53ae24e9d026e9c</tei:email>
<tei:email type="domain">ehu.es</tei:email>
</tei:editor>
</tei:titleStmt>
<tei:editionStmt>
<tei:edition n="v1">
<tei:date type="whenSubmitted">2006-04-06 11:51:12</tei:date>
</tei:edition>
<tei:edition n="v2" type="current">
<tei:date type="whenSubmitted">2006-06-22 13:24:42</tei:date>
<tei:date type="whenModified">2024-03-12 14:16:04</tei:date>
<tei:date type="whenReleased">2006-06-22 13:58:20</tei:date>
<tei:date type="whenProduced">2006-06-22</tei:date>
<tei:date type="whenEndEmbargoed">2006-06-22</tei:date>
<tei:ref target="https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2/document" type="file">
</tei:ref>
<tei:ref n="1" target="https://artxiker.ccsd.cnrs.fr/artxibo-00000094v2/file/Basque_PropBank.pdf" type="file">
</tei:ref>
</tei:edition>
<tei:respStmt>
<tei:resp>contributor</tei:resp>
<tei:name key="110024">
<tei:persName>
<tei:forename>Izaskun</tei:forename>
<tei:surname>Aldezabal</tei:surname>
</tei:persName>
<tei:email type="md5">367c233f0cb8a90cf53ae24e9d026e9c</tei:email>
<tei:email type="domain">ehu.es</tei:email>
</tei:name>
</tei:respStmt>
</tei:editionStmt>
<tei:publicationStmt>
<tei:distributor>CCSD</tei:distributor>
<tei:idno type="halId">artxibo-00000094</tei:idno>
<tei:idno type="halUri">https://artxiker.ccsd.cnrs.fr/artxibo-00000094</tei:idno>
<tei:idno type="halBibtex">agirre:artxibo-00000094</tei:idno>
</tei:publicationStmt>
<tei:seriesStmt>
<tei:idno n="SHS" type="stamp">Sciences de l'Homme et de la Société</tei:idno>
<tei:idno n="AO-LINGUISTIQUE" type="stamp">Archives ouvertes de la Linguistique</tei:idno>
<tei:idno n="OR-COLLCODE" type="stamp">Portail Artxiker</tei:idno>
<tei:idno n="ARTXIKER" type="stamp">Portail Artxiker</tei:idno>
</tei:seriesStmt>
<tei:notesStmt>
<tei:note n="1" type="audience">Not set</tei:note>
<tei:note n="0" type="invited">No</tei:note>
<tei:note n="0" type="popular">No</tei:note>
<tei:note n="1" type="peer">Yes</tei:note>
<tei:note n="1" type="proceedings">Yes</tei:note>
</tei:notesStmt>
<tei:sourceDesc>
<tei:biblStruct>
<tei:analytic>
<tei:title lang="en">A Preliminary Study for Building the Basque PropBank</tei:title>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Eneko</tei:forename>
<tei:forename type="middle">E.</tei:forename>
<tei:surname>Agirre</tei:surname>
</tei:persName>
<tei:idno type="halauthorid">149946-0</tei:idno>
</tei:author>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Izaskun</tei:forename>
<tei:surname>Aldezabal</tei:surname>
</tei:persName>
<tei:email type="md5">367c233f0cb8a90cf53ae24e9d026e9c</tei:email>
<tei:email type="domain">ehu.es</tei:email>
<tei:idno notation="numeric" type="idhal">832964</tei:idno>
<tei:idno notation="string" type="halauthorid">136571-832964</tei:idno>
</tei:author>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Jone</tei:forename>
<tei:surname>Etxeberria</tei:surname>
</tei:persName>
<tei:idno type="halauthorid">136572-0</tei:idno>
</tei:author>
<tei:author role="aut">
<tei:persName>
<tei:forename type="first">Eli</tei:forename>
<tei:surname>Pociello</tei:surname>
</tei:persName>
<tei:idno type="halauthorid">136573-0</tei:idno>
</tei:author>
</tei:analytic>
<tei:monogr>
<tei:idno status="INCOMING" type="halJournalId">44164</tei:idno>
<tei:title level="j">Proceedings of the 5th International Conference on Language Resources and Evaluations (LREC)</tei:title>
<tei:imprint>
<tei:date type="datePub">2006</tei:date>
</tei:imprint>
</tei:monogr>
</tei:biblStruct>
</tei:sourceDesc>
<tei:profileDesc>
<tei:langUsage>
<tei:language ident="en">English</tei:language>
</tei:langUsage>
<tei:textClass>
<tei:keywords scheme="author">
<tei:term lang="fr">semantic annotation</tei:term>
<tei:term lang="fr">semantic roles</tei:term>
<tei:term lang="fr">PropBank</tei:term>
<tei:term lang="fr">Basque PropBank</tei:term>
</tei:keywords>
<tei:classCode n="shs.langue.trai.lexi" scheme="halDomain">Humanities and Social Sciences/Linguistics/Automatic Processing of the Language/Lexicography-Semantics</tei:classCode>
<tei:classCode n="info.info-cl" scheme="halDomain">Computer Science [cs]/Computation and Language [cs.CL]</tei:classCode>
<tei:classCode n="shs.langue.trai.ress" scheme="halDomain">Humanities and Social Sciences/Linguistics/Automatic Processing of the Language/Linguistic Resources (Corpuses, Glossaries, Grammars...)</tei:classCode>
<tei:classCode n="COMM" scheme="halTypology">Conference papers</tei:classCode>
<tei:classCode n="COMM" scheme="halOldTypology">Conference papers</tei:classCode>
<tei:classCode n="COMM" scheme="halTreeTypology">Conference papers</tei:classCode>
</tei:textClass>
<tei:abstract lang="en">
<tei:p>This paper presents a methodology for adding a layer of semantic annotation to a syntactically annotated corpus of Basque (EPEC), in terms of semantic roles. The proposal we make here is the combination of three resources: the model used in the PropBank project (Palmer et al., 2005), an in-house database with syntactic/semantic subcategorization frames for Basque verbs (Aldezabal, 2004) and the Basque dependency treebank (Aduriz et al., 2003). In order to validate the methodology and to confirm whether the PropBank model is suitable for Basque and our treebank design, we have built lexical entries and labelled all argument and adjuncts occurring in our treebank for 3 Basque verbs. The result of this study has been very positive, and has produced a methodology adapted to the characteristics of the language and the Basque dependency treebank. Another goal of this study was to study whether semi-automatic tagging was possible. The idea is to present the human taggers a pre-tagged version of the corpus. We have seen that many arguments could be automatically tagged with high precision, given only the verbal entries for the verbs and a handful of examples.</tei:p>
</tei:abstract>
</tei:profileDesc>
</tei:biblFull>
</tei:listBibl>
</tei:body>
<tei:back>
<tei:listOrg type="structures">
<tei:org status="INCOMING" type="laboratory" id="struct-12730">
<tei:orgName>IXA taldea - Lengoaia eta sistema - Euskal Herriko Unibertsitatea (Donostia)</tei:orgName>
<tei:desc>
<tei:address>
</tei:address>
<tei:ref type="url">http://ixa.si.ehu.es</tei:ref>
</tei:desc>
<tei:listRelation>
</tei:listRelation>
</tei:org>
<tei:org status="VALID" type="institution" id="struct-37123">
<tei:orgName>University of the Basque Country = Euskal Herriko Unibertsitatea</tei:orgName>
<tei:orgName type="acronym">UPV / EHU</tei:orgName>
<tei:date type="start">1980-02-25</tei:date>
<tei:desc>
<tei:address>
<tei:addrLine>Barrio Sarriena s/n, 48940 Leioa, Bizkaia</tei:addrLine>
</tei:address>
<tei:ref type="url">http://www.ehu.es/</tei:ref>
</tei:desc>
</tei:org>
</tei:listOrg>
</tei:back>
</tei:text>
</tei:TEI>