Unsaon Paggamit ang 'Ngram Viewer' Tool sa Google Books

Ang usa ka Ngram, kasagarang gitawag nga usa ka N-gram usa ka istatistikanhong pagsusi sa sulod sa teksto o sinultian aron makit-an ang n (usa ka numero) sa usa ka matang sa butang sa teksto. Mahimo kining tanan nga matang sa mga butang, sama sa mga phonemes, prefix, hugpong sa mga pulong, o mga sulat. Bisan tuod ang N-gram medyo kulang sa gawas sa tigdukiduki, kini sa tinuud gigamit sa nagkalainlain nga mga natad, ug adunay daghan nga mga implikasyon alang sa mga tawo nga naghimo sa mga programa sa kompyuter nga nakasabut ug mitubag sa natural nga pinulongan. Nga sa ato pa, ang interes sa Google sa ideya.

Sa kaso sa Google Books Ngram Viewer, ang pag-analisar sa teksto naggikan sa daghang libro nga gi-scan sa Google gikan sa mga pampublikong librarya aron mapuno ang ilang Google Books search engine. Alang sa Google Books Ngram Viewer, ilang gipunting ang teksto nga imong susihon isip "corpus." Ang korporal sa Ngram Viewer gibahinbahin pinaagi sa pinulongan, bisan tuod mahimo ka mag-analisa sa tagsa-tagsa nga Ingles ug Amerikano nga Iningles o magkatapok niini. Gipili kini nga sobra nga makapaikag sa pagpalayo gikan sa British ngadto sa Amerikanhon nga paggamit sa mga termino ug makita ang mga tsart nga nausab.

Giunsa sa Ngram Works

  1. Lakaw ngadto sa Google Books Ngram Viewer sa books.google.com/ngrams.
  2. Ang mga butang mga sensitibo sa kaso, dili sama sa Google nga mga pagpangita sa Web, busa siguruha nga ibutang ang husto nga nouns.
  3. Isulat ang bisan unsa nga hugpong sa mga pulong o hugpong sa mga pulong nga gusto nimo nga analisahon Siguroha ang pagbulag sa matag hugpong sa mga pulong nga adunay koma. Ang Google nagsugyot, "si Albert Einstein, Sherlock Holmes, Frankenstein" aron makasugod ka.
  4. Sunod, i-type ang usa ka date range. Ang default mao ang 1800 ngadto sa 2000, apan adunay mas bag-o nga mga libro (2011 mao ang pinaka-bag-o nga gilista sa dokumentasyon sa Google, apan kana tingali nausab.)
  5. Pagpili og usa ka corpus. Mahimo ka mangita sa mga pinulongan sa mga pinulongan sa pinulongan o Iningles, ug dugang sa mga kapilian nga mga pagpili, makamatikod ka sa mga butang sama sa "English (2009) o American English (2009)" sa ubos. Kini nga mga daan nga corpora nga bag-o sa Google ang na-update, apan duna ka'y ​​rason aron mahimo ang imong mga pagtandi batok sa daan nga mga datos sa datos. Kadaghanan sa mga tigdumala mahimong dili manumbaling kanila ug mag-focus sa labing bag-o nga corpora.
  6. Ibutang ang imong smoothing level. Ang pagpahiyom nagtumong sa unsa ka hamis ang grapula sa katapusan. Ang labing tukma nga representasyon mao ang usa ka smoothing nga lebel sa 0, apan mahimo nga lisud ang pagbasa. Ang default gibutang sa 3. Sa kadaghanang mga kaso, dili nimo kinahanglan nga i-adjust kini.
  1. Ipadayon ang pagpangita sa daghang mga libro nga buton. (Mahimo ka usab nga makaigo sa pagsulod sa search prompt.)

Unsa ang gipakita sa Ngram?

Ang Google Books Ngram Viewer mopagawas sa graph nga nagrepresentar sa paggamit sa usa ka partikular nga hugpong sa mga libro pinaagi sa panahon. Kon nakasulod ka labaw sa usa ka pulong o hugpong sa mga pulong, imong makita ang mga linya nga may kolor nga mga kolor aron itandi ang lainlaing mga termino sa pagpangita. Kini susama sa Google Trends , ang search lamang naglangkob sa mas taas nga panahon.

Ania ang usa ka tinuod nga kinabuhi nga panig-ingnan. Kami nahibulong mahitungod sa suka nga pie bag-o lang. Gihisgutan sila sa Little House sa Laura Ingalls Wilder sa serye sa Prairie , apan wala pa kami nakadungog sa maong butang. Una namong gigamit ang pagpangita sa Google sa Google aron makat-on og dugang mahitungod sa mga pie nga suka. Dayag, giisip sila nga bahin sa Amerikano nga lut-od sa pagkaon ug sa tinuud gihimo gikan sa suka. Sila nagpatalinghog balik sa mga panahon nga dili ang tanan adunay access sa bag-ong abot sa tanang panahon sa tuig. Mao ba kana ang tibuok nga sugilanon?

Gipangita namon ang Google Ngram Viewer, ug adunay mga paghisgot sa pie sa sayo ug sa ulahing bahin sa mga 1800, daghang gihisgutan sa mga 1940, ug nagkadaghang mga gihisgutan sa bag-ohay nga mga panahon (tingali ang pie nostalgia.) Hinoon, adunay pipila ang problema sa datos sa usa ka smoothing nga lebel sa 3. Adunay usa ka patag ibabaw sa mga gihisgutan sa 1800. Tino nga dili managsama ang gidaghanon sa mga paghisgot sa usa ka partikular nga pie matag tuig sulod sa lima ka tuig? Ang nagakahitabo mao nga tungod kay dili daghan ang mga libro nga gipatik sa panahon nianang panahona, ug tungod kay ang atong datos gitakda nga hapsay, kini magdaot sa hulagway. Tingali adunay usa ka basahon nga naghisgot sa suka nga pie, ug kini nag-average na aron malikayan ang pagtaas. Pinaagi sa paghimo sa smoothing sa 0, atong makita nga kini gayud mao gayud ang kahimtang. Ang spike nagsentro sa 1869, ug adunay lain nga paglambo sa 1897 ug 1900.

Wala bay naghisgot bahin sa suka nga pie sa nahabilin nga panahon? Tingali ilang gihisgutan ang mga pie. Adunay mga lagmit nga mga resipe nga naglutaw sa tibuok dapit. Wala lang sila nagsulat bahin niini sa mga libro, ug kini usa ka limitasyon sa mga pagpangita sa Ngram.

Advanced Ngram Searches

Hinumdomi kung giunsa namo gisulti nga ang Ngrams mahimong maglakip sa tanan nga nagkalainlain nga pagpangita sa teksto? Gitugotan ka sa Google nga mag-drill ka usab sa Ngram Viewer usab. Kung gusto ka mangita sa isda ang berbo inay isda ang nombre, mahimo nimo kana pinaagi sa paggamit sa mga tag. Sa kini nga kaso, imong pangitaon ang "fish_VERB"

Ang Google naghatag og kompletong listahan sa mga sugo nga imong magamit ug uban pang mga advanced nga dokumentasyon sa ilang website.