Ffurfiant, Addysg uwchradd ac ysgolion
Dull cymydog agosaf: Enghraifft o waith
y dull cymydog agosaf yn y classifier fetrig hawsaf sy'n seiliedig ar werthuso'r tebygrwydd gwahanol wrthrychau.
gwrthrych ddadansoddwyd yn perthyn i'r dosbarth y maent yn perthyn bynciau o sampl hyfforddi. Gadewch i ni gael gwybod sef y cymydog agosaf. Ceisiwch ddeall y mater cymhleth, enghreifftiau o wahanol dechnegau.
dull hypothesis
Gall dull cymydog agosaf yn cael ei ystyried fel y algorithm mwyaf cyffredin a ddefnyddir ar gyfer dosbarthu. Gwrthrych cael dosbarthiad yn perthyn i'r y_i dosbarth, y mae'r dysgu sampl x_i gwrthrych agosaf.
Penodolrwydd o ddulliau cymdogion agosaf
k dull cymydog agosaf yn gallu gwella cywirdeb dosbarthiad. gwrthrych ddadansoddwyd yn perthyn i'r un dosbarth â rhan fwyaf o'i gymdogion, hynny yw, k agos ato gwrthrychau o'r x_i sampl a ddadansoddwyd. Wrth ddatrys problemau gyda dau ddosbarth o nifer y cymdogion yn rhyfedd i osgoi sefyllfa o amwysedd, os bydd yr un nifer o gymdogion yn perthyn i wahanol ddosbarthiadau.
Mae'r dechneg o gymdogion hatal
dull a ddadansoddwyd-postgresql tsvector cymdogion agosaf yn cael ei ddefnyddio pan fydd nifer y dosbarthiadau o leiaf dri, ac ni allwch ddefnyddio odrif. Ond amwysedd yn codi hyd yn oed yn yr achosion hyn. Yna, mae'r i-fed cymydog yn cael pwysau w_i, sy'n gostwng gydag rheng cymydog i. Mae'n cyfeirio at y dosbarth y gwrthrych, a fydd yn cael cyfanswm uchafswm pwysau ymysg cymdogion agos.
Mae'r ddamcaniaeth o chrynoder
Yn ganolog i bob un o'r dulliau uchod yn y ddamcaniaeth o chrynoder. Mae'n awgrymu cysylltiad rhwng y mesur o debygrwydd o wrthrychau a'u perthyn i'r un dosbarth. Yn y sefyllfa hon, mae'r ffin rhwng y gwahanol fathau yn ffordd syml, ac yn creu dosbarthiadau o wrthrychau yn y gofod ardal symudol gryno. Dan ardaloedd o'r fath yn y dadansoddiad mathemategol i olygu set ffinio gau. Nid yw'r ddamcaniaeth yn gysylltiedig â'r canfyddiad pob dydd y gair.
Mae'r fformiwla sylfaenol
Gadewch i ni edrych yn fwy cymydog agosaf. Os yw'r hyfforddiant arfaethedig math sampl "gwrthrych-ymateb» X ^ m = \ {(x_1, y_1), \ dotiau, (x_m, y_m) \}; os yw lluosogrwydd o wrthrychau i ddiffinio'r pellter ffwythiant \ Rho (x, x '), sy'n cael ei gynrychioli ar ffurf model tebygrwydd digonol o wrthrychau drwy gynyddu gwerth y ffwythiant yn lleihau tebygrwydd rhwng gwrthrychau x, x'.
Ar gyfer unrhyw wrthrych, bydd u yn adeiladu sampl hyfforddi gwrthrychau x_i gyda cynyddol pellteroedd u:
\ Rho (u, x_ {1; u}) \ LEQ \ Rho (u, x_ {2; u}) \ LEQ \ cdots \ LEQ \ Rho (u, x_ {m; u}),
lle x_ {i; u} nodweddu'r sampl dysgu gwrthrych, sydd yn i-ed ffynhonnell cymydog gwrthrych u. nodiant a defnydd o'r fath ateb i-th gymydog: y_ {i; u}. O ganlyniad, rydym yn gweld bod unrhyw wrthrych u ennyn rifo sampl ei hun.
Penderfynu ar y nifer k cymdogion
Dull cymydog agosaf pan k = 1 yn gallu rhoi dosbarthiad anghywir, nid yn unig ar wrthrychau-allyriadau, ond hefyd ar gyfer dosbarthiadau eraill sy'n agos.
Os byddwn yn cymryd k = m, bydd y algorithm mor sefydlog a bydd yn dirywio i fod yn werth cyson. Dyna pam y dibynadwyedd yn bwysig osgoi mynegeion eithafol k.
Yn ymarferol, maen prawf gan fod y mynegai k gorau posibl a ddefnyddir llithro rheolaeth.
allyriadau dangosiadau
Amcanion yr astudiaeth yn anghyfartal i raddau helaeth, ond yn eu plith mae rhai sy'n cael y nodweddion o ddosbarth a chyfeirir atynt fel safonau. Ar agosrwydd y pwnc i'r model delfrydol o'i tebygolrwydd uchel o berthyn i'r dosbarth hwn.
Sut rezultativen ddull o gymdogion agosaf? Mae enghraifft i'w gweld ar y sail y categorïau ymylol a heb fod yn llawn gwybodaeth o wrthrychau. Tybir amgylchedd trwchus y gwrthrych chynrychiolwyr eraill o'r dosbarth hwn. Pan fyddwch yn eu tynnu oddi ar y dosbarthiad samplu ansawdd Ni fydd yn dioddef.
Ewch i mewn nifer penodol o samplau Gall pyliau sŵn sy'n cael eu "ar lawr gwlad" o ddosbarth. Cael gwared effaith sylweddol gadarnhaol ar ansawdd y dosbarthiad.
Os yw'r sampl a gymerwyd o'r gwrthrychau sŵn nad yw'n dweud llawer a chael gwared, gallwch chi ddibynnu ar rai canlyniadau cadarnhaol ar yr un pryd.
Y cyntaf dull rhyngosod o'r dosbarthiad cymydog agosaf yn caniatáu i wella ansawdd, lleihau faint o ddata ei storio, lleihau'r amser o ddosbarthiad, sy'n cael ei wario ar y dewis o safonau nesaf.
Mae'r defnydd o samplau ultra-mawr
Dull cymydog agosaf yn seiliedig ar storio go iawn o wrthrychau dysgu. I greu iawn samplau ar raddfa fawr gan ddefnyddio problem dechnegol. Y nod nid yn unig i arbed swm sylweddol o wybodaeth, ond hefyd yn y swm lleiaf o amser i gael amser i ddod o hyd i unrhyw wrthrych u k ymysg y cymdogion agosaf.
Er mwyn ymdopi â'r dasg hon, dau ddull yn cael eu defnyddio:
- sampl deneuo drwy ryddhau heb data gwrthrychau;
- defnyddio strwythur data arbennig effeithiol a chodau ar gyfer chwilio unwaith y cymdogion agosaf.
Rheolau dulliau dethol
Ystyriwyd y dosbarthiad uchod. Dull cymydog agosaf yn cael ei ddefnyddio wrth ddatrys problemau ymarferol, sy'n cael ei adnabod o flaen llaw y pellter ffwythiant \ Rho (x, x '). Mewn gwrthrychau disgrifio fectorau rhifol defnyddio metrig Ewclidaidd. Mae gan y dewis dim cyfiawnhad arbennig, ond yn cynnwys mesur holl arwyddion "yn yr un raddfa." Os nad yw ffactor hwn yn cael ei ystyried, yna bydd y metrig yn bennaf nodwedd cael gwerthoedd rhifol uchaf.
Os oes swm sylweddol o nodweddion, cyfrifo pellter fel swm y gwyriadau ar symptomau penodol yn ymddangos dimensiwn broblem ddifrifol.
Yn y gofod ddimensiwn uchel bell oddi wrth ei gilydd, bydd yr holl wrthrychau. Yn y pen draw, bydd unrhyw sampl yn nesaf at y gwrthrych sy'n cael ei astudio k cymdogion. dewis nifer fechan o nodweddion llawn gwybodaeth i gael gwared ar y broblem hon. Algorithmau ar gyfer cyfrifo amcangyfrifon yn adeiladu ar sail y gwahanol setiau o arwyddion, ac ar gyfer pob unigolyn adeiladu eu swyddogaeth agosrwydd.
casgliad
cyfrifiadau mathemategol yn aml yn cynnwys y defnydd o amrywiaeth o dechnegau sydd wedi eu nodweddion unigryw, manteision ac anfanteision eu hunain. Gall weld dull cymydog agosaf datrys yn eithaf yn broblem ddifrifol, oherwydd y nodweddion o wrthrychau mathemategol. Mae'r cysyniad arbrofol, yn seiliedig ar y dull a ddadansoddwyd yn cael ei ddefnyddio yn weithredol mewn deallusrwydd artiffisial.
Yn y systemau arbenigo mae angen nid yn unig i dosbarthu gwrthrychau, ond hefyd yn dangos y defnyddiwr esboniad o'r dosbarthiad o dan sylw. Yn y dull hwn, esboniad o'r ffenomen hon yn cael eu mynegi mewn perthynas â gwrthrych o ddosbarth arbennig yn ogystal â'i leoliad mewn perthynas â'r sampl a ddefnyddiwyd. arbenigwyr y diwydiant cyfreithiol, daearegwyr, meddygon, yn cymryd hyn yn "cynsail" rhesymeg yn weithredol yn ei ddefnyddio yn eu hymchwil.
Er mwyn cael eu dadansoddi dull oedd y mwyaf dibynadwy, effeithlon, gan roi canlyniadau a ddymunir, rhaid i chi gymryd ffigwr isafswm k, tra hefyd yn osgoi allyriadau ymhlith y gwrthrychau a ddadansoddwyd. Dyna pam y defnydd o safonau a'r dull dethol, yn ogystal â'r metrigau optimization.
Similar articles
Trending Now