{"id":1053,"date":"2021-07-29T09:05:02","date_gmt":"2021-07-29T08:05:02","guid":{"rendered":"https:\/\/perso.atilf.fr\/sollinge\/?page_id=1053"},"modified":"2024-02-09T09:14:30","modified_gmt":"2024-02-09T08:14:30","slug":"dixem","status":"publish","type":"page","link":"https:\/\/perso.atilf.fr\/sollinge\/projets\/dixem\/","title":{"rendered":"DIXEM"},"content":{"rendered":"<p style=\"text-align: left\"><span style=\"font-family: Open Sans Condensed;font-size: 1.5em\">Traitement s\u00e9mantique de corpus : projet DIXEM, 2006 &#8211; 2010<\/span><\/p>\n<p>Responsable : <a href=\"http:\/\/www.inalco.fr\/enseignant-chercheur\/mathieu-valette\" rel=\"noopener\" target=\"_blank\">Mathieu Valette<\/a><\/p>\n<p>L\u2019\u00e8re num\u00e9rique modifie sensiblement les pratiques li\u00e9es au texte. Les applications telles que la navigation sur Internet ou la Gestion \u00c9lectronique de Documents (GED) sont demandeuses de nouvelles m\u00e9thodologies et de nouvelles fa\u00e7ons d\u2019appr\u00e9hender le texte. Comme elles ont les textes comme mat\u00e9riau d\u2019\u00e9tude privil\u00e9gi\u00e9, les sciences humaines et sociales sont tenues de renouveler le discours scientifique sur le texte dans cette perspective num\u00e9rique.<\/p>\n<p>La veille, la recherche d\u2019information, l\u2019analyse th\u00e9matique et de fa\u00e7on plus g\u00e9n\u00e9rale toutes les activit\u00e9s li\u00e9es au traitement des documents num\u00e9riques, butent sur des probl\u00e8mes de niveaux d\u2019observation et d\u2019observables. Le mot, ou des substituts tels que le lemme, constituent les principales unit\u00e9s linguistiques prises en compte, et lorsque l\u2019on a recours \u00e0 des lexiques s\u00e9mantiques pour enrichir les textes, il s\u2019agit dans la grande majorit\u00e9 des cas d\u2019ontologies ou de th\u00e9saurus, lesquels ne constituent qu\u2019une mani\u00e8re parmi d\u2019autres de repr\u00e9senter le sens.<br \/>\nLe projet DIXEM a d\u00e9velopp\u00e9 une perspective alternative dans laquelle un texte n\u2019est plus consid\u00e9r\u00e9 comme un sac de mots ni comme une suite de phrases, mais comme un ensemble de faisceaux de traits s\u00e9mantiques. Ces faisceaux de traits sont discontinus, stabilis\u00e9s en corpus et de taille variable (du mot au texte). Ils assurent la coh\u00e9sion du texte et son int\u00e9gration dans un corpus. On les appellera des formes s\u00e9mantiques.<\/p>\n<p>Cette notion de forme s\u00e9mantique pr\u00e9sente l\u2019int\u00e9r\u00eat crucial d\u2019\u00eatre un objet empirique susceptible \u00e0 la fois d\u2019\u00eatre \u00e9tudi\u00e9 scientifiquement, et pouvant \u00eatre assimil\u00e9, dans la perspective de l\u2019ing\u00e9nierie des connaissance, \u00e0 un th\u00e8me s\u00e9mantique voire \u00e0 un concept non lexicalis\u00e9. L\u2019objectif de ce projet est donc de d\u00e9velopper un dispositif exp\u00e9rimental (outil informatique, m\u00e9thodes d\u2019apprentissage statistique et ressource linguistique) visant \u00e0 :<br \/>\napprofondir les connaissances actuelles sur les formes s\u00e9mantiques connues et notamment r\u00e9f\u00e9renc\u00e9es par la s\u00e9mantique structurale,<br \/>\nen identifier de nouvelles que la th\u00e9orie n\u2019a pas su jusque l\u00e0 reconna\u00eetre faute d\u2019une instrumentation ad\u00e9quate, autrement dit,<br \/>\ncr\u00e9er de nouveaux observables s\u00e9mantiques, textuels et lexicaux.<\/p>\n<p>Le projet DIXEM a \u00e9t\u00e9 soumis deux fois \u00e0 l\u2019ANR mais n\u2019a pas \u00e9t\u00e9 s\u00e9lectionn\u00e9.<\/p>\n<p style=\"text-align: right\"><em>source : ancien site www.atilf.fr<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Traitement s\u00e9mantique de corpus : projet DIXEM, 2006 &#8211; 2010 Responsable : Mathieu Valette L\u2019\u00e8re num\u00e9rique modifie sensiblement les pratiques li\u00e9es au texte. Les applications telles que la navigation sur Internet ou la Gestion \u00c9lectronique de Documents (GED) sont demandeuses de nouvelles m\u00e9thodologies et de nouvelles fa\u00e7ons d\u2019appr\u00e9hender le texte. Comme elles ont les textes [&hellip;]<\/p>\n","protected":false},"author":17,"featured_media":0,"parent":15,"menu_order":4,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-1053","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/pages\/1053","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/users\/17"}],"replies":[{"embeddable":true,"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/comments?post=1053"}],"version-history":[{"count":5,"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/pages\/1053\/revisions"}],"predecessor-version":[{"id":1363,"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/pages\/1053\/revisions\/1363"}],"up":[{"embeddable":true,"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/pages\/15"}],"wp:attachment":[{"href":"https:\/\/perso.atilf.fr\/sollinge\/wp-json\/wp\/v2\/media?parent=1053"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}