Машиналық оқыту туралы жалпы және қызықты деректер

Машиналық оқыту туралы жалпы және қызықты деректер

Машиналық оқыту дегеніміз не?

Машиналық оқыту (Engl. Machine learning, ML) — бұл жасанды интеллект әдістерінің классы. Оның сипаттамасы мәселені тікелей шешу емес, көптеген ұқсас мәселелерге шешім қолдану процесінде жаттығу болып табылады. Мұндай әдістерді құру үшін математикалық статистика, сандық әдістер, оңтайландыру әдістері, ықтималдық теориясы, графтар теориясы, сандық түрде мәліметтермен жұмыс істеудің әртүрлі әдістері қолданылады. Машиналық оқыту күнделікті біздің өмірімізде көптеген қолданыстарға ие болуда. Оның қолданылуының кеңдігіне байланысты IT технологияда маңызды орын алады. Қазіргі кезде машиналық оқыту әдістеріне негізделген кейбір қосымшалар жақсы жұмыс істейді. Жасанды Интеллект туралы мақаланы мына жерден оқи аласыз: Жасанды Интеллект қалай пайда болды?

Машиналық оқыту жасанды интеллекттің бір саласы болып саналады. Оның негізгі идеясы компьютер алдын-ала жазылған алгоритмді қолданумен ғана шектеліп қоймай, мәселені өздігімен шешуді үйрену. Кез келген жұмыс машиналық оқыту технологиясын шартты түрде қол жетімділікке байланысты үш деңгейдің біреуіне тағайындалуы мүмкін. Бірінші деңгей — бұл Google немесе IBM деңгейіндегі әртүрлі технологиялық алыптар үшін қол жетімді болған кезде. Екінші деңгей — белгілі бір білімі бар студент оны қолдана алатын кезде. Үшінші деңгей — бұл тіпті ата-әжелер оны басқара алатын кез. Қазір машиналық оқыту екінші және үшінші деңгейлердің түйіскен жерінде, осы технологияның көмегімен әлемнің өзгеру қарқыны күн сайын артып келеді.

Жұмыс істеу принципі

Машиналық оқыту тапсырмаларының көпшілігін “бақыланатын оқытуға” (supervised learning) және “бақыланбайтын оқытуға” (unsupervised learning) бөлуге болады. «Бақыланатын» түсінігінде адамның мәліметтерді өңдеуге араласуы деп түсініледі. Адам машиналық оқытуға араласқан кезде бізде белгілі бір болжамалы ақпараттар бар. Ал адамсыз оқу кезінде бізде тек анықталатын мәліметтер болады. 

1. Бақыланатын оқыту. Мысалы, бізде Алматы қаласындағы 10 000 пәтерлер туралы мәліметтер бар. Сондай-ақ, әр пәтердің ауданы, бөлмелер саны, орналасқан қабаты, автотұрақтың болуы, метро станциясына дейінгі қашықтық және басқалары белгілі. Сонымен қатар, әр пәтердің құны белгілі. Біздің міндетіміз — осы белгілер негізінде пәтердің құнын болжай алатын модель құру. Бұл бақыланатын оқытудың классикалық мысалы. Мұндай тапсырма регрессиялық есеп деп аталады. Басқа мысалдар: әр түрлі медициналық көрсеткіштерге негізделген ақпараттар бойынша науқаста қатерлі ісіктің бар-жоғын болжау. Немесе электрондық поштаның мәтініне сүйене отырып, бұл спамның ықтималдығын болжау және т.б.

Машиналық оқыту жұмыс істеу принципі
http://www.machinelearning.ru/

2. Бақыланбайтын оқыту. Бұл оқыту өте қызықты болып келеді. Себебі біз нақты дұрыс жауабын білмейміз. Мысалы, бізге белгілі бір адамдардың бойы мен салмағы туралы деректер берілсін. Деректерді 3 санатқа (немесе топ) топтастыру керек. Сонымен қатар адамдардың әр санаты үшін қолайлы өлшемдегі көйлек жасау керек. Бұл тапсырма класстерлік тапсырмасы деп аталады. 

Машиналық оқыту класстерлік тапсырмасы
https://www.intuit.ru/

Машиналық оқытудың класстары

Регрессиялық мәселелер. Әр түрлі белгілерге сүйене отырып, материалдық реакцияны болжау. Басқаша айтқанда, жауап 1, 5, 23.575 немесе кез-келген нақты сан болуы мүмкін. 

Жіктеу мәселесі. Әр түрлі белгілер негізінде категориялық жауапты болжау. Мысалдар: мәтінді қолжазбамен тану, фотосуреттегі адамның немесе мысықтың бар-жоғын анықтау. 

Класстерлік мәселелер: мәліметтерді ұқсас категорияларға бөлу. Мысалдар: ұялы байланыс операторы клиенттерінің төлем қабілеттілігі бойынша бөлу, ғарыш объектілерінің ұқсас заттарға бөлу және т.б. (галактикалар, планеталар, жұлдыздар және басқалар). 

Өлшемді азайту мәселесі: біздің мәліметтерімізді N белгілерімен емес, кішірек санмен сипаттауға үйрену (әдетте кейінгі визуализация үшін 2-3). Мысал ретінде, визуализация қажеттілігінен басқа, деректерді сығуды келтіруге болады.

Аномалияларды анықтауға байланысты мәселелер: белгілер негізінде аномалияларды «аномалиялардан» айыра білуді үйрену. Бұл міндеттің жіктеу мәселесінен еш айырмашылығы жоқ сияқты. Бірақ аномалияны анықтаудың ерекшелігі — бізде модельді үйрету үшін аномалиялардың мысалдары өте аз немесе мүлдем жоқ. Сондықтан біз классификация мәселесін шеше алмаймыз.