Машин сурах нь компьютерийн системд тодорхой програмчлалгүйгээр автоматаар суралцах чадварыг өгдөг. Гэхдээ машин сурах систем хэрхэн ажилладаг вэ? Тиймээс, машин сурах амьдралын мөчлөгийг ашиглан дүрсэлж болно. Машин сурах амьдралын мөчлөг нь үр дүнтэй машин сургалтын төслийг бий болгох цикл процесс юм. Амьдралын мөчлөгийн гол зорилго нь асуудал эсвэл төслийн шийдлийг олох явдал юм.
Машин сурах амьдралын мөчлөг нь долоон үндсэн үе шатыг хамардаг бөгөөд тэдгээрийг доор өгөв.
- Мэдээлэл цуглуулах
- Мэдээлэл бэлтгэх
- Мэдээллийн маргаан
- Өгөгдөлд дүн шинжилгээ хийх
- Загварыг сургах
- Загварыг турших
- Орлуулах
Бүрэн боловсруулалтын хамгийн чухал зүйл бол асуудлыг ойлгож, асуудлын зорилгыг мэдэх явдал юм. Тиймээс амьдралын мөчлөг эхлэхээс өмнө асуудлыг сайн ойлгох хэрэгтэй бөгөөд учир нь сайн үр дүн нь асуудлыг илүү сайн ойлгохоос хамаарна.
Бүрэн амьдралын мөчлөгийн явцад асуудлыг шийдэхийн тулд бид "загвар" нэртэй машин сургалтын системийг бий болгодог бөгөөд энэ загварыг "сургалт" -аар хангах замаар бүтээдэг. Гэхдээ загварыг сургахын тулд бидэнд мэдээлэл хэрэгтэй тул амьдралын мөчлөг нь мэдээлэл цуглуулахаас эхэлдэг.
1. Мэдээлэл цуглуулах:
Мэдээлэл цуглуулах нь машин сурах амьдралын мөчлөгийн эхний алхам юм. Энэ алхамын зорилго нь өгөгдөлтэй холбоотой бүх асуудлыг олж илрүүлэх явдал юм.
Энэ алхамд бид файл , өгөгдлийн сан , интернет , мобайл төхөөрөмж гэх мэт янз бүрийн эх үүсвэрээс мэдээлэл цуглуулж болох тул өөр өөр мэдээллийн эх үүсвэрийг тодорхойлох хэрэгтэй . Энэ бол амьдралын мөчлөгийн хамгийн чухал алхамуудын нэг юм. Цуглуулсан мэдээллийн тоо хэмжээ, чанар нь гаралтын үр ашгийг тодорхойлох болно. Өгөгдөл илүү их байх тусам таамаглал илүү нарийвчлалтай байх болно.
Энэ алхамд дараахь ажлууд орно.
- Төрөл бүрийн мэдээллийн эх үүсвэрийг тодорхойлох
- Мэдээлэл цуглуулах
- Өөр өөр эх сурвалжаас авсан өгөгдлийг нэгтгэх
Дээрх даалгаврыг гүйцэтгэснээр бид өгөгдлийн сан гэж нэрлэдэг уялдаа холбосон өгөгдлийг авдаг . Үүнийг цаашдын алхамуудад ашиглах болно.
2. Мэдээлэл бэлтгэх
Мэдээлэл цуглуулсны дараа бид дараагийн алхамуудад бэлтгэх хэрэгтэй. Мэдээлэл бэлтгэх нь бид өөрсдийн өгөгдлийг тохиромжтой газар байрлуулж, машин сургалтын бэлтгэлд ашиглах алхам юм.
Энэ алхамд эхлээд бүх өгөгдлийг нэгтгэж, дараа нь өгөгдлийн эрэмбийг гаргана.
Энэ алхамыг хоёр процесс болгон хувааж болно:
- Мэдээлэл хайх:
Бидэнтэй ажиллах ёстой мэдээллийн мөн чанарыг ойлгоход ашигладаг. Мэдээллийн шинж чанар, формат, чанарыг бид ойлгох хэрэгтэй.
Өгөгдлийг илүү сайн ойлгох нь үр дүнтэй үр дүнд хүргэдэг. Эндээс бид корреляци, ерөнхий чиг хандлага, гаднах байдлыг олж хардаг. - Мэдээллийг урьдчилан боловсруулах:
Одоо дараагийн алхам бол түүнийг дүн шинжилгээ хийх зорилгоор өгөгдлийг урьдчилан боловсруулах явдал юм.
3. Мэдээллийн зөрчил
Мэдээллийн зөрчил нь түүхий эдийг цэвэрлэх, ашиглах боломжтой формат руу хөрвүүлэх үйл явц юм. Энэ нь өгөгдлийг цэвэрлэх, ашиглах хувьсагчийг сонгох, дараагийн алхамд дүн шинжилгээ хийхэд илүү тохиромжтой болгохын тулд өгөгдлийг зохих формат болгон өөрчлөх үйл явц юм. Энэ бол бүрэн гүйцэд үйл явцын хамгийн чухал алхамуудын нэг юм. Чанарын асуудлыг шийдвэрлэхийн тулд өгөгдлийг цэвэрлэх шаардлагатай.
Бидний цуглуулсан өгөгдөл үргэлж бидний ашиглалтын шаардлага биш тул зарим өгөгдөл хэрэггүй байж болох юм. Бодит хэрэглээний програмуудад цуглуулсан өгөгдөл нь янз бүрийн асуудалтай байж болно, үүнд:
- Утга алга байна
- Өгөгдлийг хуулбарлах
- Буруу дата
- Дуу чимээ гарна
Тиймээс бид өгөгдлийг цэвэрлэхийн тулд янз бүрийн шүүлтүүрийн аргыг ашигладаг.
Энэ нь үр дүнгийн чанарт сөргөөр нөлөөлж болзошгүй тул дээр дурдсан асуудлыг олж илрүүлэх, арилгах шаардлагатай байна.
4. Мэдээллийн дүн шинжилгээ
Одоо цэвэрлэж, бэлтгэсэн өгөгдлийг шинжилгээний алхам руу шилжүүлэв. Энэ алхам нь дараах зүйлийг агуулна.
- Шинжилгээний арга техникийг сонгох
- Барилгын загварууд
- Үр дүнг хянана уу
Энэхүү алхамын зорилго нь өгөгдлийг янз бүрийн шинжилгээний арга ашиглан дүн шинжилгээ хийх, үр дүнг нь хянах машин сурах загварыг бий болгох явдал юм. Асуудлын төрлийг тодорхойлохоос эхэлж ангилах , регресс , кластер шинжилгээ , холбоо гэх мэт машин сургалтын техникийг сонгоод дараа нь бэлэн өгөгдлийг ашиглан загварыг боловсруулж, загварыг үнэлнэ.
Тиймээс, энэ алхам дээр бид өгөгдлийг авч, загварыг бий болгохын тулд машин сурах алгоритмыг ашигладаг.
5. Галт тэрэгний загвар
Одоо дараагийн алхам бол загварыг сургах явдал юм. Энэ алхамд бид асуудлаа илүү сайн шийдвэрлэхийн тулд өөрийн загварыг гүйцэтгэлээ сайжруулахын тулд сургадаг.
Машин сурах алгоритм ашиглан загварыг сургахын тулд өгөгдлийн санг ашигладаг. Загвар сургах нь янз бүрийн хэв маяг, дүрэм журам, онцлог шинж чанарыг ойлгох чадвартай байх шаардлагатай.
6. Туршилтын загвар
Манай машин сургалтын загварыг өгөгдсөн мэдээллийн санд сургаж авсны дараа загварыг туршиж үздэг. Энэ алхам дээр бид туршилтын өгөгдлийн өгөгдлийг гаргаж өгснөөр өөрийн загварын үнэн зөв эсэхийг шалгана.
Загварыг турших нь тухайн төслийн тодорхойлолтын нарийвчлалыг төсөл эсвэл асуудлын шаардлагын дагуу тодорхойлдог.
7. Орлуулах
Машин сурах амьдралын мөчлөгийн сүүлчийн алхам бол байршуулалт бөгөөд бид загварыг бодит ертөнцөд байрлуулдаг.
Хэрэв дээр нь боловсруулсан загвар нь манай шаардлагын дагуу хүлээн зөвшөөрөгдсөн хурдтайгаар үнэн зөв үр дүнг гаргаж байгаа бол бид загварыг бодит системд байрлуулна. Гэхдээ төслийг байршуулахаасаа өмнө бэлэн байгаа өгөгдлийг ашиглан гүйцэтгэл сайжирч байгаа эсэхийг шалгах болно. Байршуулалтын үе шат нь төслийн эцсийн тайланг гаргахтай төстэй юм.
No comments:
Post a Comment