Nhazi na Data Mining

Nhazi bụ usoro ntinye data nke na-ekenye edemede na nchịkọta data iji nyere aka na amụma na nyocha dị mma karị. A na-akpọkwa ya mgbe ụfọdụ a na-akpọ Osisi Mkpebi , nhazi dị iche iche bụ otu n'ime ụzọ dị iche iche a chọrọ iji mee nchọpụta nke nnukwu ebe nrụọrụ weebụ.

Gịnị mere Nhazi?

Nnukwu ọdụ data dị ukwuu na-aghọwanye ụkpụrụ n'ụwa taa nke "nnukwu data." Were ya na nchekwa data nwere otutu terabytes nke data -a terabyte bụ otu octets nke data.

Facebook naanị crunches 600 terabytes nke data ọhụrụ kwa ụbọchị (dika nke afọ 2014, oge ikpeazụ ọ kọọrọ nkọwa ndị a). Ihe ịma aka kachasị mkpa nke nnukwu data bụ otú e si amata ya.

Ọ bụghị naanị nsogbu dị na ya: data buru ibu na-agbanwe agbanwe, na-agbanwe agbanwe ma na-agbanwe ngwa ngwa. Tụlee ihe ọdịyo na vidio, ihe mgbasaozi mmadụ, data 3D ma ọ bụ data geospatial. A naghị edozi ụdị data a ma ọ bụ hazie.

Iji mezuo ihe ịma aka a, e mepụtara ụzọ dịgasị iche iche nke ụzọ mgbochi maka iwepụta ozi bara uru, n'etiti ha nhazi .

Kedu ka ọkwa nhazi

Maka ihe ize ndụ nke ịgafe na nkà na ụzụ, ka anyị tụlee otú ọrụ nhazi. Ihe mgbaru ọsọ bụ ịmepụta usoro nhazi nke nhazi nke ga-aza ajụjụ, ime mkpebi, ma ọ bụ ịkọ ọdịiche. Iji malite, a malitere usoro nhazi ọzụzụ nke nwere ụfọdụ njirimara àgwà nakwa yana ọ ga-esi pụta.

Ọrụ nke nhazi ọkwa algọridim bụ ịchọpụta otú ụdị àgwà a si ruo ọgwụgwụ.

Ihe atụ : Ikekwe otu ụlọ ọrụ na-akwụ ụgwọ ka ọ na-agbalị ịchọta nke atụmanya kwesịrị ịnweta onyinye kaadị akwụmụgwọ.

Nke a nwere ike ịbụ usoro ihe ọmụma ya:

Data Ọzụzụ
Aha Afọ Ibu nwoke Ego Onu Ego Onyinye Kaadị Nweta
John Doe 25 M $ 39,500 Mba
Jane Doe 56 F $ 125,000 Ee

Okpokoro "predictor" Age , Gender , na Annual Income na- ekpebi uru nke "ọdịdị ịkọ ọdịnihu" Onyinye Kaadị E Si Nweta . Na nhazi ọzụzụ, a maara njirimara onye amụma. Nhazi nke algorithm mgbe ahụ na-agba mbọ chọpụta otú uru nke ọdịdị amụma ahụ si rute: olee mmekọrịta dị n'etiti ndị amụma na mkpebi? Ọ ga-emepe usoro iwu amụma, na-abụkarị nkwupụta IFỤMỌDỤ / THEN, dịka ọmụmaatụ:

Ọ BỤRỤ na (Afọ> 18 OR Ọkara <75) NA Onyinye Ogologo> 40,000 MGBE E Si Nweta Kaadị = ee

N'ụzọ doro anya, nke a bụ ihe atụ dị mfe, na algorithm ga-achọ ntinye data data dị ukwuu karịa ederede abụọ e gosiri ebe a. Ọzọkwa, iwu amụma ahụ ga-abụrịrị mgbagwoju anya, gụnyere iwu nchịkwa iji wepụta nkọwa ndị agwa.

Ọzọ, a na-enye algorithm "amụma amụma" nke data iji nyochaa, mana nke a enweghi ọdịdị amụma (ma ọ bụ mkpebi):

Data Predictor
Aha Afọ Ibu nwoke Ego Onu Ego Onyinye Kaadị Nweta
Jack Frost 42 M $ 88,000
Mary Murray 16 F $ 0

Nkọwa data a na-enye aka na-atụle nzibi nke iwu ndị amụma ahụ, a na-emezi iwu ndị ahụ ruo mgbe onye mmepụta na-atụle amụma ndị dị irè ma baa uru.

Ihe atụ nke nhazi ọkwa kwa ụbọchị

Nhazi, na usoro ntinye ihe omuma ndi ozo, bu otutu ihe omumu anyi kwa ubochi dika ndi ahia.

Amụma ihu igwe nwere ike iji nhazi ọkwa mara ma ụbọchị ga-ezo, anwụ na-acha ma ọ bụ ígwé ojii. Ndị ọkachamara ahụike nwere ike nyochaa ọnọdụ ahụ ike iji kọwaa ọgwụ ndị ahụ. Ụdị usoro nhazi, Naive Bayesian, na-eji ọnọdụ nwere ike ịmepụta ozi ịntanetị. Site na nchọpụta aghụghọ na onyinye ntanetị, nhazi dị n'azụ ọnọdụ kwa ụbọchị na-enyocha data ma na-emepụta amụma.