威博十字花科植物菘藍及其基因組! 作者:nb11 2020 年 6 月 8 日 板藍根是對草本植物菘藍根的叫法,也被稱為“北板藍根”。菘藍為十字花科菘藍屬二年生草本植物,基生葉蓮座狀,長圓形至寬倒披針形,股票e票通全緣或稍具波狀齒;莖生葉長橢圓形或長圓狀披針形;花瓣4片,黃色或淺黃色,十字形排列;雄蕊6,4長2短;短角果近長圓形,扁平,邊緣有翅。據根(板藍根)、葉(大青葉)均供藥用,據中國植物志和中國藥典描述:板藍根具有清熱解毒、涼血消斑和利咽止痛等功效,可治溫病發熱、發斑、風熱感冒、咽喉腫痛、丹毒、流行性乙型腦炎、肝炎和腮腺炎等症;在臨床上臨床常用于流行性感冒、上呼吸道感染等多種疾病的治療。體外研究顯示板藍根對多種病毒有一定抑制作用;此外,《遼寧常用中草藥手冊》還記載了菘藍可用于治肝硬化。菘藍的基因組有多大?2020年2月1日,Horticulture Research 在線發表了標題為“A chromosome-scale genome assembly of Isatis indigotica錛 an important medicinal plant used in traditional Chinese medicine”的研究論文,該研究構建了大小為293.88 Mb和scaffold N50 = 36.16 Mb的參考基因組,並注釋了30錛323個蛋白編碼基因。研究人員也獲得了一些參與到□□類、□類和苯丙酸類代謝途徑的候選基因。還有一種名字叫“板藍”的植物,估計不在少數的朋友認為“板藍”和“板藍根”具有一定的關系。實際上“板藍”和上述的“板藍根”沒有關系,“板藍根”並非是植物“板藍”的根。板藍也稱為馬藍,該植物為爵床科板藍屬多年生草本,葉橢圓形或卵形,邊緣有稍粗鋸齒;穗狀花序,花冠圓筒形,頂端內彎,喉部擴大呈窄鐘形,稍彎曲,狹鐘形喉為冠管兩倍長,冠簷常5裂,每裂片具有凹陷;雄蕊4枚,2長2短;據中國植物志描述,板藍的根和葉也可入藥,有清熱解毒、涼血消腫之效,可預防流腦、流感,治中暑、腮腺炎、腫毒、毒蛇咬傷、菌痢、急性腸炎、咽喉炎、口腔炎、扁桃體炎和肝炎等,中醫藥中也有把板藍的根稱作“南板藍根”的叫法。【立委按】大疫當前,學問緩行。此集算是閉關隔離的副產品吧。白:“顏色”與“紅”的關系,和“紅”與“大紅、深紅、磚紅、朱紅、玫瑰紅…”的關系,是一樣的嗎?顏色是屬性名,紅是屬性值,大紅、深紅、磚紅、朱紅、玫瑰紅…是細化屬性值。屬性值-細化屬性值的關系,和屬性名-屬性值的關系,要區別對待。李:那自然。本體知識庫(ontology), 如 HowNet(《知網》), 就是這麼區分的。屬性值屬于邏輯形容詞,有自己的 taxonomy (上下位鏈條)。屬性名屬于邏輯名詞,其上位是抽象名詞。屬性名與其相應的屬性值是一一對應的關系。如,【味道】 與 “酸甜苦辣” ,【氣味】與“香、臭 …”,【形狀】 與 “方、圓、菱形、三角、多角 …”,等等。白:那還有沒有“屬性”這個語義範疇?另外就是“宿主”掛在誰那兒?掛在屬性名?屬性值?還是屬性?李:【屬性】可以置于 【顏色】、【形狀】 … 與 【抽象名詞】 之間。白:我不是這個意思。我是說,既然分別有了屬性名和屬性值,那還需要有屬性麼?如果不需要,那宿主跟誰?李:邏輯形容詞(屬性值|AttributeValue)屬于邏輯謂詞(Predicate),謂詞挖坑。白:這就是不要屬性了。李:【形狀】類邏輯形容詞挖坑,要求【物體】。所以,本體上可以說,“桌子是圓的”;不能說,“思想是圓的”。違反常識本體的,只能是比喻:“圓的思想”,真要說的話,大概是指思想的 “圓滑、中庸”。白:這個案件的兇手是張三,殺害李四的兇手是張三,其兇手是張三。“兇手”是“角色名”,能否得到“屬性名”的類似待遇?N/X,當X匹配動詞蘿卜時,是具體事件在填坑;在X匹配名詞蘿卜時,是抽象事件在填坑。抽象事件是具體事件的指稱性概括。具體事件還可以進行陳述性概括。紅之于大紅,就是陳述性概括;顏色之于紅,就是指稱性概括。is-a無法區分指稱性概括和陳述性概括。李:那就是兩條線上的 ISA,兩個不同角度,所以一個兒子應該允許有兩個或多個老子。本體知識庫中的taxonomy理應如此,可以認定其中一個是主鏈條,其他的是附加鏈條。“兇手” 與 “張三” 的對應,與【屬性名】與【屬性值】的對應不同。前者是種類(角色)與專名的關系,都屬于邏輯名詞。後者是邏輯名詞與邏輯形容詞的 “跨類別” 對應關系。白:“這張桌子的顏色是紅的。” 桌子究竟填“顏色”還是“紅”還是兩者都填?“這張桌子的顏色有點紅。” 填誰?桌子填顏色,顏色填紅?還是桌子填both?如果顏色的坑是“物體PhysicalObject”,紅的坑也是,那麼顏色就無法填紅的坑。大小S就有問題。“象鼻子有點長”vs.“桌子顏色有點紅”“象鼻子長度有點長”,雖然碌□晃□從鋟□!白雷油榷丈械愫□保考褪糶悅浞□匚煥嗨疲鏌逕匣褂形侍狻W雷油榷涑鮒苯泳褪橇硪桓齠韻罅恕Q丈淙朧俏鍰澹涑鍪鞘糶悅緩歟淙朧俏鍰澹涑鍪鞘糶災怠J糶裕Ω檬鞘糶悅屬性值二元組。紅的輸入不是屬性名。這個二元組之一可以default,如果從值到名不混淆的話。但是“紅”還有“人氣高”的意思,跟另一個屬性名“人氣”還勾勾搭搭。于是,“這個歌手有點紅”,雖然歌手也是物體,但更是公眾人物。李:小s “顏色” 是大 S “桌子腿兒” 的 aspect,謂詞“有點紅”要求大S填坑,與小s構成總分對應關系;句法上,ios遊戲推薦2020小s類似于 PP 狀語“論color”。白:腿兒是中s,桌子是大s。李:由于總分的對應關系屬于常識,是記憶在靜態的本體知識中,因此小s實際上是冗餘信息。這就說明了為什麼我們覺得 “桌子腿兒顏色有點紅” 攏涫導視鏌寰褪恰白雷油榷械愫□薄0祝菏侵檔矯成淶□唬揮每詞遣皇淺J丁!把丈惶躍□鋇敝械摹把丈本筒荒蓯 @叡褐檔矯成淶□唬褪淺J叮親羆虻□姆擲嘈統J叮漢焓且恢盅丈U庵殖J對 ontology 中是必須表達的,沒有新意,不具有情報性。白:這是系統自身就能確定的事實,不需要借助于常識機制。李:總之都在 ontology 裡面。前者是概念分類,屬于事實,毋庸置疑;後者是趨向性常識,常有例外。【動物】吃【食物】,例外是,“某個動物吃了石頭”。白:把“紅”換成“深”試試:這張桌子腿兒顏色深。“深”的坑,誰來填?“這張桌子腿兒顏色過深”,“這張桌子腿兒顏色太深”。“這張桌子腿兒顏色過紅”,“這張桌子腿兒顏色太紅”,紅的坑,誰來填?屬性名和值同時出現在一個合法的句子裡,是繞不過去的。總要說明白,是怎麼填坑的。“這張桌子腿兒顏色太紅”語義上不等于“這張桌子腿兒太紅”。不僅可以是“紅的程度太甚”而且還可以是“太偏向于紅”。在ontology裡,新葡京娛樂場不僅要給名和值各自以相應的地位,還要給它們的坑賦予相應的本體標簽。李:“顏色”分“深淺”,4支連碰多少錢“腿兒”分“高矮、粗細”。白:高矮是“高度”這個屬性名下的值,粗細是“徑向大小”這個屬性名下的值。說起來跟紅和顏色的關系都一樣,不能厚此薄彼。李:【屬性名】、【屬性值】、【物體】是個三角關系。可以利用【屬性名】作為橋梁,具有概括性。但是,【屬性名】與【物體】的對應是靜態本體知識,沒有情報性,屬于ontology裡面對 schema 定義中的 type appropriateness 的描述。而【屬性值】填的蘿卜,是動態的知識,這才屬于語言理解得出的情報。白:“顏色深”就有情報了,基金淨值深不是屬性值。“顏色花哨”“顏色怯”“顏色俗”都不是屬性值,都有情報性。李:這是層次糾纏。“深”、“淺”、“花哨”、“俗”、“怯”,當然也是【屬性值】白:不是具體顏色,怎麼說是屬性值?李:【屬性值】的蘿卜對象不應該只局限于【物體】呀。這兒其蘿卜不再是具體【物體】,而是抽象的東西,即【物體】的一個側面【顏色】。再如,【程度】、【垂直高度】等抽象概念也一樣論“深淺”的。白:等等,宿主都變了。是對顏色的comments。垂直高度是屬性值。李:具體的垂直高度,譬如“深、淺、高、矮”是【屬性值】,但“垂直高度”本身則是【屬性名】。白:這裡的邏輯不順,滿是問題。李:沒有問題。如果誤讀,那是層次糾纏的幹擾。邏輯名詞分為具體與抽象,深淺描述的對象是抽象名詞。白:“邏輯名詞”並不是本體概念吧。李:是。是本體概念鏈條處于頂端(TOP)的一個節點。白:董老師叫“萬物”。李:對,董老師命名為 【thing|事物】,下面有【抽象】,也有【具體】,【具體】下面有【PhysicalObject】。【thing】,我稱之為邏輯名詞,屬于跨語言的本體概念。白:在本體文獻裡不常見。李:叫什麼名不重要,實質就是,語言的POS各有不同,但背後的概念本體其實也有對應的東西。【thing】 就是【邏輯n】,【AttributeValue】 就是【邏輯a】白:“行為”算不算thing?“紅”算不算thing?“紅是一種象征革命的顏色”,“那是一種非常大氣的紅”。李:不算,【行為】是【邏輯v】,“紅”是【ColorValue】,屬于【邏輯a】。上例的“紅”是邏輯形容詞到了具體語言以後名物化,777水果盤遊戲成為名詞了,但本體概念是恆定不變的,依然是【邏輯a】。白:eat算不算“行為”的實例?李:eat 算【行為】,是【邏輯v】。到了具體語言以後,譬如英語,“eating”借助形態 -ing,就是 thing了,屬于抽象名詞。白:不應該是兩個義原。處理為兩個義原會遇到很多問題,一定是一個。李:對,本體裡面不應該是兩個義原,因此“eat”作為概念,永遠是邏輯v,“紅”永遠是邏輯a。有個簡單的辦法解決這個問題,詞典裡面的本體分類是一個,但句法分類可以變換。這種變換在形態語言裡面用的是形態,非形態語言可用零形式根據上下文來決定。eat 作為概念就是邏輯v,但在具體語言使用中成為詞的時候,可能是 POS N 或者 POS V。白:可以往指稱和陳述兩個方向概括,所以thing是指稱性概括的總根子。下面通過抽象事件、抽象性質、抽象行為,可以平滑過渡到具體事件、具體性質、具體行為。陳述性概括的總根子,應該也有一個。eat通過“行為”也會被thing罩住才對。正如“紅”通過“顏色”也會被thing罩住。指稱和陳述的分叉口是通過句法提供的。底下是一套人馬,上面是兩塊牌子。不做成這樣,會有巨大的麻煩。句法結構強制,可以分叉。範疇詞(屬性名)也可以分叉。李:對呀。異曲同工,英雄所見,大原則都是相同的,具體表示(representation)層面的技術性差異而已。白:“紅這種顏色在中國股市裡表示漲,在西方股市裡表示跌”。範疇詞就是命名ontology非葉子節點的詞。李:範疇詞,軟件界叫做“保留字”。保留字是元概念,但自然語言也有實際但詞匯對應它。從表示手段看,只要允許一個兒子有兩個老子,ontology 就好辦了。白:DAG李:對。“紅”的上位是【ColorValue】,屬于【AttributeValue】 (我叫它邏輯a);“紅”的另一個上位是【顏色|Color】。白:萬物,其中就包括事件,這是根本。李:也許這要問愛因斯坦了 LOL白:就好像,程序的代碼也是數據,打馮諾依曼起就這麼玩兒了。程序的執行是另一回事兒。事件的發生/展開/執行,也是另一回事兒。李:純粹從形式表示看,不過就是個命名問題。假設【萬物】就是唯一的 TOP,TOP 下面還是 n a v。白:n a v 並不是TOP的直接子節點。顏色下面才有紅,行為下面才有eat。顏色、行為,我這裡叫“範疇詞”,往上都是【萬物】,往下才分n v a,範疇詞是分叉點。李:也行,也許更自然。其實不過是原來 n下面的抽象子類中的成分,被提升了一個節點而已,讓它們作為橋梁通向TOP。不覺得有本質變化,需要用到的一子多父的鏈條都在。【顏色】(ColorValue)、【形狀】、【外貌】、【品性】等等與TOP之間,應該有一個節點 叫 AttributeValue (邏輯a)。鏈條大體是這樣的:紅 》 顏色 》attribute 〉TOP英俊 》外貌 》attribute 〉TOPeat 》action 》behaviour 〉TOP桌子 》家具 》產品類 》物體 》具體 》thing 〉TOP白:對。李:換湯不換藥。在我看來,頂部概念有三,thing 就是邏輯n,behaviour 就是邏輯v,attribute(i.e. AttributeValue) 就是邏輯a。白:問題是,下面的這些邊並不都是is-a李:至于在他們上面再加一個 TOP 統領,那是一個哲學的觀點,不是一個實用的需求。白:不是的。不是這麼統領的。屬性、狀態、關系相互獨立,但都有可能是形容詞。李:紅 》 ColorValue 》AttributeValue(邏輯a) 》Predicate(謂詞);紅 》Color 》AbstractObject 》thing(邏輯n)就是讓“紅”有兩個老子:ColorValue 是屬性名,屬于邏輯a;而 Color 是屬性類,屬于邏輯n,白:這盞燈很亮,說的是屬性。這盞燈真亮,說的是狀態。李:為什麼要這麼細分?白:作為屬性的亮,說的只是某種定性或定量的亮度指標,但燈並不必然處于點亮狀態。作為狀態的亮,是真實點亮了的,其亮度是可感的。後者可以推出燈的點亮狀態,前者不能。不是說有兩個“亮”的詞條或義原,而是說往上走有兩個岔路。通往屬性和通往狀態各有不同。李:就句子論句子,多數人沒有這種區分吧。“很”、“真”都是程度副詞。白:不好說。多數人還沒語法概念呢,但是該區分的都區分了。可以設計問卷。我相信多數人都推的出。李:順便說一句,30年前董老師剛開始醞釀 HowNet 的時候,我們正好在中關村的高立公司有半年多在一起做項目,董老師談 HowNet 的設想。當時對董老師主張對邏輯語義和本體知識網絡這些東西覺得特別有興趣。可是回到宿舍在紙面上想把思路想清楚,很快就覺得跌入了語義學對深淵。有一種畏難情緒。那時剛入行,歷練不夠,實踐也不足,只得知難而退了…. 30年後算是坐享其成了。白:我不認為hownet可以達到讓人坐享其成的程度了。李:哈 各人要求不同吧。前面提到對顏色、屬性之類 HowNet 都 encode 進去了。還有很多很細的分類和梳理的工作以及體系建設。我覺得是是自成體系、自圓其說,比較 comprehensive 的了。白:這都是應有之義,但遠遠不夠。作為數字版的辭書,很好。作為可計算的基礎設施,還有改進的空間。李:自然可以改造使用。舉個例子。hownet 把 Attribute 與 AttributeValue 分開,命名方式一致,但是是兩個岔。這在客觀上造成了 features 數量 double 了的結果。在採用的過程中,覺得雖然這樣一來【屬性名】(邏輯名詞)與【屬性值】(邏輯形容詞)從 category 角度是分清楚了,但是多了這麼多 features 感覺不必要,累贅。于是做了如下變通:顏色:color category紅色:color attribute二者共用了 color 這個 feature。其區分可以用 features 之間的 AND 來表示。如果照搬 HowNet,詞典標注大體是這樣的:顏色:ColorAttribute紅色:Color至于 ColorAttribute 與 Color 的對應關系,那是在 HowNet 內部聯系的(除了命名的助記效果外)。經過改造,都用 color 以後,這種關系就直接體現在詞典的 features 中了。好處是 HowNet 基本上把概念梳理出來了,這裡不過是做了實用主義的技術性改造。一個語言的詞匯表中,表示 atrribute value 的邏輯形容詞,遠遠多于 表示其種類的詞。有幾百個表示顏色的詞,但“顏色”本身只有一兩個詞(“顏色”、“色彩”)。為後者另外命名一套 features 感覺很不合算,也不方便。白:本來就是某種意義上的“上位”。李:一個是直接來一條豎線串聯下來,而董老師是中間插了一條橫線,等價于一個兒子兩個老子,表示手段不同。一橫一豎也不是沒有道理。畢竟 “玫瑰紅” 到 “紅” 的 ISA 關系 與 “紅” 到 “顏色” 的 ISA 不是同類的上下位。白:值與名的關系不是嚴格意義上的上下位關系。橫過來當然是可以的。這是指稱性和陳述性的分叉,與一般的多爹不同。李:實際應用中,這種區分沒什麼必要。何況需要區分的時候,還是有辦法區分,多一個feature(而不是重復幾十個平行的對應 features)就齊了。白:看是誰家的實際應用了。“陳述性義原的指稱性概括”,或者叫“跨域上位”。李:對,跨類、跨層次的關聯。這就好比概念與“元”概念的區別一樣。一不留神,可以引起層次糾纏。可以說“紅太陽”、“白太陽”,甚至“黑太陽”,不能說 “顏色太陽”。(擱文革時候,提“紅太陽、白太陽、黑太陽”,立馬打成現行反革命呢,絕對逃不過的。時代還是進步了。)白:動詞也有同樣的問題另外就是同樣在名詞這邊,角色名,是從屬于事件的,是事件折射回來的。比如一開始提到的“兇手”。“兇手”從屬于“殺人”事件,殺人事件可以跨域追溯到上位名詞“案件”,于是“兇手”也可以間接從屬于“案件”。也就是說,一個具體事件的坑,可以被它的上位抽象事件所繼承。李:“殺人” 有個【agent】 坑,這個坑的 type 是 【human】,如果細分的話,就是 【兇手】。【兇手】 》【肇事者】》human“殺人”(名物化)指的是一種案件,案件是事件,“殺人”的坑裡面的蘿卜,自然就是案件/事件中的角色。白:我不認為HowNet在這些方面提供了ready的計算機制。李:有空可以細看一下,我覺得 HowNet 做得很細,應該把“案件”與“殺人” 關聯了,“殺人”與“兇手”關聯了。至于這些關聯的計算機制,有什麼函數可以調用,這些方面,HowNet 的確不強,至少是不好用。白:問題殺人是動詞,案件/事件是名詞,跨域了。如果不揭示這個動詞到名詞的概括關系,就沒有理由給名詞挖一個關聯的坑。我們的處理,“兇手”是N/X,分母上的X填動詞蘿卜時,就是具體事件的角色名;填名詞蘿卜時,就是抽象事件的角色名。角色名和屬性名,應該用類似機制處理,這才簡明好用。在實例層面能做到,和在表示層面、機制層面能做到是不一樣的。“兇手”是agent的實例,或者某個下位。李:對。類似的角色還有“受害者”、“受益人”,甚至“施事”、“受事”、“對象”這些詞所對應的概念。這些都是元概念,恰好與邏輯語義系統內部的角色定義【施事】、【受事】等相交了。查“兇手”的定義:兇手乃是殺人之施事。“刺客” 是 “兇手” 的細分,“兇手”是“施事”的細分。白:我們叫範疇詞,顏色、長度、程度……,也都是。引入了名-值體系,對ontology意味著什麼?我看到的是:打開了橫向跨域關聯的通道。不僅“事件”本身可以通向“萬物”,就連配屬于“事件”的“角色”也可以通向“萬物”,在其中找到概括自己的抽象物。這才符合馮諾依曼的原則:程序也是數據。實際上,細化屬性值(如“磚紅、翠綠”等)很少直接作謂語,更多的是作定語,也就是說用法類似北大體系裡的“區別詞”。修飾語對被修飾語的要求與約束,與“坑”屬于同一個數據類型。與“坑”不同的是,它會在修飾語與被修飾語的結合中,把這些要求和約束傳遞給被修飾語,這個傳遞過程有點像“合一(unification)”。作為一個特例,當修飾語升格時,這些要求和約束會傳遞給作為升格結果的那個零成分。“坑”本身也有要求和約束,在填坑時反向傳遞給蘿卜,蘿卜如果可以再復用,這些反向接受來的標簽可以像自己從詞典裡帶來的標簽一樣使用。比如“我吃的”,會從坑裡接收Food標簽。我們把修飾語攜帶的對潛在被修飾語要求和約束的標簽集合體稱為“修飾目標”,生造了一個詞Modee。一個修飾語,自身有一套語義標簽,又為修飾目標準備了一套語義標簽。自身的語義標簽是雙軌制的:一方面指向自己的上位屬性值,另一方面指向自己的對應屬性名。上位屬性值仍在謂詞領域,屬性名就跨越到了體詞領域。這不同于一般的多爹,是跨域多爹。李:修飾目標與謂詞目標(邏輯主語)在形式邏輯上是統一的,都是挖了一個目標坑,期望同一類型的蘿卜。喬姆斯基句法也做了類似本體語義的抽象,謂語的句法主語與名詞的定語,被認為都處于所謂 specifier 的 position,具有某種結構同質性。作為典型的修飾語,形容詞就是挖了這麼個需要主語或被修飾語的坑。至于形容詞中的子類“區別詞”(“男”、“女”等),不能做謂語,只能做修飾語,那是語言內部的某種句法約束習慣,不是邏輯語義層面的約束。區別詞在中文不能做謂語,並不代表在其他語言不能做謂語。但無論做謂語還是修飾語,其本體對于目標的要求是跨語言的。世界語中,就可以說:la vir-o est-as vir-a(the man is male)la vir-o vir-as(the man male-s)說明:世界語形態中,-o 是名詞,-a 是形容詞,-as 是謂語(現在時)。這些都是本體外語言層面的東西。這樣看來,應該用另一個feature或其他方式來區別謂語和修飾語,而在本體邏輯層面它們都是是同一個挖坑者(謂詞)。作為邏輯謂詞的形容詞,在句法結構中做了謂語還是修飾語,是本體靜態知識外的情報。這種由句法結構而來的信息區分,也是語義理解的一部分,也必須在語義結構的解析圖中反映出來,但並不影響謂詞挖坑者對目標蘿卜的本體約束方面的統一要求。白:N+和S/N究竟使用哪一個標簽,可以在詞法階段解決,也可以在句法階段解決。這不是問題。作補語和作定語就不一樣:喝 好酒 vs 喝好 酒李:形式邏輯比較粗暴或粗陋,前者就是:喝(酒)& 好(酒);後者則是:好(喝(酒))。當然不同。不同的原因是“好” 太廣譜:挖的坑針對的目標可以是體詞,也可以是謂詞。白:“紅 太陽”也好,“太陽 紅”也好,“紅”所對應的句法標簽“N+”和“S/N”可以同時存在,交給句法去選擇。語義標簽則是同一套。“太陽 紅”中如果“紅”取N+會導致dead end。而“紅 太陽”中,修飾操作優先級本來就高于填坑操作。所以選擇下來沒難度。詞典裡語義標簽是同一套數據。但在構建N+成分和S/N成分時,標簽數據的裝載方式略有不同。李:詞典信息給多個約束 features 是自然的,本來這些信息也都是針對潛在關系對象的。等到實現的時候(走了一個結構路徑的時候),另一條路往往自然堵死。白:相反的情況是走了一條死路時,活路的優先級自然處于當前最高位。只要分析過程中用過的成分允許再用。李:詞典信息中的語義本體的挖坑信息( semantic expectation features )應該是同一的,是句法的句型信息(syntactic subcat features)各有不同。expectation 與 subcat 是兩套,是對于遣詞造句的兩個不同維度的約束條件。前者是跨語言的約束,後者才是具體語言的約束。所謂基于知識的解析(knowledge-based parsing),說到底就是從 semantic expectation 出發,看語言如何以某個 syntactic subcat pattern 來實現。因為人就是這麼從思想外化為語句的,深度解析再現了這個逆過程,平衡了句法和語義兩個維度 的約束。白:形容詞是二元化處理(N+和S/N),動詞是一元化處理(S/*)。動詞作定語通過降格實現,而且是白名單制,金讚電子遊戲場需要特定條件滿足才激活。李:中文經典結構歧義案例是:“學習文件”,“炒雞蛋”。從本體約束看,“文件” 是可以被“學習”的,統一電子遊戲場才可以做被修飾語(即NP的中心詞),表示是“(所/要)學習(的)文件”。白:炒雞蛋當菜名可以,炒蘇北草雞蛋當菜名就差意思了。李:如果是 “學習 x”,則不可能是定中結構,只能是動賓結構。因為 x 未定,沒有本體信息,作為白名單不滿足蘿卜的約束。但它卻在黑名單之外,符合要求。同理,“炒 x”只能是動賓。如果是 “炒【food】”,在中文就歧義了。白:擴展的food也不靈,只能是動賓。李:這種結構歧義,源于本體語義對于arg的坑與對于 modee 的坑,約束完全相同,而恰好句法的詞序約束(動在賓前,定在中前)也同時符合兩種結構的要求。為了消歧,必須在本體約束外找細瑣的條件或heuristics,譬如音節數pattern(2-2pattern,1-2pattern更多是定中結構,2以上的N趨向于是動賓結構),是否開放還是可以死記(定中結構作為菜名,開放性不如動賓結構),遊艇會娛樂場以及蘿卜本身的結構特點(是裸蘿卜N 還是穿衣的蘿卜 Noun Group:有定語特別是長定語的N,差不多都是賓語),等等。白:死記和開放有不同的優先級。 【相關】【語義計算:李白對話錄系列】【置頂:立委NLP博文一覽】《朝華午拾》總目錄,