Saturday, January 4, 2020

Хяналттай, хяналтгүй машин сурах

Хяналттай, хяналтгүй машин сурах

CHI програм хангамж
2019 оны 5-р сарын 20 · мин уншина
Машин сурах алгоритмын гол зорилго нь өгөгдлийг олж илрүүлэх загвар юм. Судалгаанд хамрагдсан асуултын төрөл, мэдээлэлд үндэслэн сургалтын алгоритмыг сонгоно. Мэдээллийн талаархи сурах арга барилын дагуу тэдгээрийг хоёр ангилалд хувааж болно. Эдгээр нь хяналттай , хяналтгүй сургалтанд хамрагддаг .
Үр дүнгийн бодит үнэлэмжийн талаар өмнө нь мэдээлэлтэй байсан бол газрын үнэнийг ашиглан алгоритм үүсгэж болно. Оролтын хувьсагч (x) ба гаралтын хувьсагч (Y) гэж үзье, харгалзах зураглалыг функцийг оролтоос гаралтад ойролцоогоор тооцоолохын тулд сурах алгоритмыг ашиглана .
Y = f (X) байна.
Зорилго нь f функцийг маш сайн олох бөгөөд ингэснээр бид шинэ, сургалт биш, оролтын өгөгдөл (x) байх үед гаралтын хувьсагчийг (Y) урьдчилан таамаглах боломжтой болно. Бид зөв хариултуудыг мэддэг бөгөөд алгоритм нь сургалтын өгөгдлүүдийн таамаглалыг цаг алдалгүй залруулдаг. Энэ нь алдаагаа засч, зөв ​​хариулт авч байгаа эсэхээ шийдэх багшаар ажилладаг. Тиймээс энэ төрлийн алгоритмыг хяналттай сургалт гэж нэрлэдэг бөгөөд энэ нь сургалтын процесст бүрэн шошго хийгдсэн өгөгдөл байгаа гэсэн үг юм. Бүрэн шошго нь алгоритмын гүйцэтгэл гэж нэрлэдэг таамаглалын нарийвчлалыг хэмжих боломжийг олгодог. Алгоритм нь гүйцэтгэлийн зохих түвшинд хүрсэн тохиолдолд сургалт зогсдог.
Алгоритмын хоёр хэлбэрийн гол ялгаа нь сурах явцдаа бодит үнэн эсвэл өмнөх мэдлэгийг ашиглахгүй байх явдал юм. Өгөгдлийн багцыг төгс шошготой, цэвэр байлгах нь үргэлж амаргүй байдаг, заримдаа боломжгүй байдаг. Тийм учраас хариултыг нь мэдэхгүй алгоритмын асуултууд хэрэгтэй байна. Энэ бол хяналтгүй суралцах арга юм. Энэхүү гарц нь шошгоогүй тул сургалтын загвар нь үүнийг хийх талаар ямар нэгэн зааварчилгаагүйгээр өгөгдлийн өгөгдлийг ашигладаг. Харгалзах гаралтын хувьсагч байхгүй байх нь өгөгдлийн цэгүүдийн байгалийн бүтцийг ойлгох зорилгыг тодорхойлдог. Хяналтгүй суралцах нь оролтын хамаарлын талаар илүү ихийг олж мэдэхийн тулд өгөгдөл дэх тархалтыг загварчлах явдал юм.
Ангилал ба регрессийн асуудал нь хяналттай суралцах нь чухал хоёр чиглэл юм. Нийтлэг алгоритмууд нь логистик регресс, гэнэн байц, дэмжих вектор машин, хиймэл мэдрэлийн сүлжээ, санамсаргүй ой гэх мэт. Ангиллын алгоритмын зорилго нь оролтын өгөгдлийг тодорхой анги, бүлгийн гишүүн гэж тодорхойлж категори буюу дискрет утгыг урьдчилан таамаглах явдал юм. Нөгөө талаар, регрессийн алгоритмын гол зорилго нь аливаа ангилал эсвэл категоритой холбоогүй дискрет эсвэл үргэлжлэх утгыг урьдчилан таамаглах явдал юм. Ангилал ба регрессийн хувьд оролтын тодорхой функцийг үр дүнтэй гаргах боломжийг олгодог. Сургалтын өгөгдлийн хувьд зөв гэж үздэг. Гарц нь үргэлж зөв байдаг гэж хэлэх биш юм. Буруу эсвэл шуугиантай мэдээллийн шошго нь сургалтын үр дүнг бууруулдаг алдааны эх үүсвэр юм. Загварын нарийн төвөгтэй байдал нь алгоритмын гүйцэтгэлд нөлөөлдөг бас нэг хүчин зүйл юм. Нарийн төвөгтэй байдлын түвшин нь сургалтын мэдээллийн шинж чанараас хамаарна. Бүх боломжит хувилбаруудын дагуу бага хэмжээний өгөгдөл эсвэл жигд бус тархалт нь бага төвөгтэй загварыг шаарддаг. Өндөр төвөгтэй байдал нь эдгээр нөхцөлд хэт их хэтрүүлэх хандлагатай байдаг. Энэ нь функцийг сурах нь сургалтын мэдээлэлтэй сайн тохирдог боловч бусад өгөгдлийн цэгүүд дээр нэгтгэгддэггүй гэсэн үг юм. Өндөр төвөгтэй байдал нь эдгээр нөхцөлд хэт их хэтрүүлэх хандлагатай байдаг. Энэ нь функцийг сурах нь сургалтын мэдээлэлтэй сайн тохирдог боловч бусад өгөгдлийн цэгүүд дээр нэгтгэгддэггүй гэсэн үг юм. Өндөр төвөгтэй байдал нь эдгээр нөхцөлд хэт их хэтрүүлэх хандлагатай байдаг. Энэ нь функцийг сурах нь сургалтын мэдээлэлтэй сайн тохирдог боловч бусад өгөгдлийн цэгүүд дээр нэгтгэгддэггүй гэсэн үг юм.
Хяналтгүй суралцахкластер, аномали илрүүлэх, дүрслэх сургалт, нягтралын тооцоо гэх мэт хамгийн түгээмэл ажил гэж нэрлэдэг. Эдгээр бүх тохиолдолд мэдээллийн далд бүтэц нь хүссэн зорилго юм. Хамгийн түгээмэл алгоритмуудад к-кластер, үндсэн бүрэлдэхүүн хэсгийн анализ, автоэнкодер орно. Шошгоогүй өгөгдлийг ашигладаг тул ихэнх хяналт шалгалгүй сурах аргуудад загвар гүйцэтгэлийг харьцуулах тодорхой арга байдаггүй. Хамгийн их хэрэглэгддэг хяналтгүй сургалтын алгоритм бол кластер юм. Энэ нь өгөгдлийн цэгүүдийг бүлгүүдийн тоонд хувааж ангилахдаа шошгоны талаархи таамаглалыг бий болгох үүднээс бодлын хоолыг өгдөг. Аномализмыг илрүүлэх нь өгөгдөл дэх ховор үзэгдлийг олох арга юм. Буруу ажиглалтыг шүүхийн тулд шинжлэх ухааны инженерчлэлд ашиглаж болно. Төлөөллийн сургалт нь холбоотой гэж үзсэн онцлог шинж чанаруудыг олж болно. Энэ нь өгөгдлийн хэмжээсийг багасгах, хяналттай аргаар тоолох журмыг хялбаршуулахын тулд онцлог инженерчлэлд ашигладаг. Автоцодерууд нь оролтын өгөгдлийг авч, оролтыг дахин хийх чадвартай код болгон шахаж, өгөгдлийг чимээ шуугиантай болгож чаддаг.
Ихэвчлэн хяналттай эсвэл хяналтгүй машин сурах алгоритмын хоорондох сонголт нь өгөгдлийн хэмжээ, бүтэцээр тодорхойлсон хүчин зүйлээс хамаардаг. Бодит байдал дээр ашиглалтын хэргийг шийдвэрлэхэд хяналттай эсвэл хяналтгүй алгоритмуудыг хоёуланг нь ашигладаг.

)

CHI програм хангамж
БИЧСЭН

Хөгжлийн төв. Вэб, гар утас, клоуд ба бусад програмын шийдлүүдийг дэлхий даяар: https://chisw.com/

No comments:

Post a Comment