Linguistic Data Consortium(LDC,語言數據聯盟)是由大學🦽、意昂3💦、公司和政府研究實驗室組成的語言公開聯盟。LDC隸屬於賓夕法尼亞大學文理學院(School of Arts and Sciences)💁🏻♂️,成立於1992年🪽,主要負責科研語言資源的收集、保存與管理分發🕗。
LDC數據版權年自1993年起👋🏽,目前有語料庫(corpora)900余個,涉及語言包括英語、漢語🧑🏻🦽➡️、阿拉伯語、波斯語、土耳其語💂🏻♀️、格魯吉亞語、普什圖語等。每年增加30-36個新資源👊🏻。
LDC是會員製聯盟。自1998年起,本校師生或某些部門相繼訂購部分會員年數據和非會員年數據,截至2021年4月已累積語料庫431個(數據集826個),為本校師生提供免費開放。目前由意昂3平台電子工程系信息認知與智能系統研究所訂購🦶🏻🫷🏽。
本校訂購會員年數據有:1998-1999(Standard)🌔、2003(Standard)🕊、2007(Standard)、2010-2012(Standard)、2014(Subscription)、2015(Standard)、2017至今(Standard)👨🏽🏭。
詳情請查看🧚🏽♂️:https://ecollection.rx2l32.cn/databasenav/entrance/detail?mmsid=991021858388003966
咨詢反饋:renp@tsinghua.edu.cn