V dannoj rabote my predlagaem nowuü strategiü prowerki faktow (poiska istiny), osnowannuü na klasterizacii dannyh mashinnogo obucheniq metodom k-means w sochetanii s indexom siluäta dlq opredeleniq optimal'nogo znacheniq k, s cel'ü wyqwleniq optimal'nogo razbieniq nabora atributow. Takoe optimal'noe razbienie maximiziruet tochnost' processa poiska istiny bez neobhodimosti issledowat' wse wozmozhnye razbieniq. Rezul'taty intensiwnyh äxperimentow na sinteticheskih i real'nyh dannyh pokazywaüt, chto nash podhod prewoshodit analogichnyj w (Lamine Ba et al., 2015), pri bolee razumnyh zatratah wychislitel'nogo wremeni. Nakonec, my opisywaem sposob rasparalleliwaniq dannogo processa poiska istiny s pomosch'ü paradigmy MapReduce, chtoby izbezhat' uwelicheniq wremeni wypolneniq pri uwelichenii razmera whodnyh dannyh.				
				
				
			Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







