Butun axtardiqlarinizi tapmaq ucun buraya: DAXIL OLUN
  Mp4 Mp3 Axtar Yukle
  Video Axtar Yukle
  Shekil Axtar Yukle
  Informasiya Melumat Axtar
  Hazir Inshalar Toplusu
  AZERI CHAT + Tanishliq
  Saglamliq Tibbi Melumat
  Whatsapp Plus Yukle(Yeni)

  • Ana səhifə
  • Təsadüfi
  • Yaxınlıqdakılar
  • Daxil ol
  • Nizamlamalar
İndi ianə et Əgər Vikipediya sizin üçün faydalıdırsa, bu gün ianə edin.

Verilənlərin analizi

  • Məqalə
  • Müzakirə

Verilənlərin analizi — məlumatların sistemli toplanması, təmizlənməsi, çevrilməsi və modelləşdirilməsi vasitəsilə faydalı informasiya əldə etmək, nəticələr çıxarmaq[1] və qərarvermə prosesini dəstəkləmək məqsədi daşıyan elmi və texnoloji fəaliyyət sahəsi. Verilənlərin analizi statistika, hesablama elmi, maşın öyrənməsi və verilənlər bazası texnologiyalarının müxtəlif metodlarını birləşdirir.[2] Bu proses ümumiyyətlə aşağıdakı mərhələlərdən ibarətdir: məlumatın toplanması və təsviri, ilkin emal (məlumatın təmizlənməsi və keyfiyyətə nəzarət), kəşfiyyat xarakterli təhlil, statistik modellərin qurulması, nəticələrin vizuallaşdırılması və interpretasiyası.[3]

Tətbiq sahələri çoxşaxəlidir: iqtisadiyyat və maliyyə, səhiyyə və biotibbi araşdırmalar, mühəndislik, sosial elmlər, həmçinin iri həcmli verilənlərdən (big data) istifadə edən sənaye və dövlət qurumları.[4] Verilənlərin analizi kəmiyyət və keyfiyyət metodlarını özündə birləşdirə bilər. Kəmiyyət analizində riyazi-statistik alətlər (reqressiya, hipotez yoxlanması, korrelyasiya) üstünlük təşkil edir, keyfiyyət yanaşmasında isə müşahidə, mətn və məzmun təhlili kimi üsullar tətbiq olunur.[5] Son illərdə süni intellekt və dərin öyrənmə texnologiyalarının inkişafı böyük həcmli məlumatların real vaxt rejimində işlənməsinə imkan yaradaraq verilənlərin analizi sahəsini daha da genişləndirmişdir.[6]

Mündəricat

  • 1 Verilənlərin analizi prosesi
    • 1.1 Verilənlərə tələblər
    • 1.2 Verilənlərin toplanması
    • 1.3 Verilənlərin emalı
    • 1.4 Verilənlərin təmizlənməsi
    • 1.5 Kəşfiyyat xarakterli verilənlər analizi
    • 1.6 Modelləşdirmə və alqoritmlər
    • 1.7 Verilənlər məhsulu
    • 1.8 Kommunikasiya
    • 1.9 Kəmiyyət mesajları
  • 2 Maliyyə sahəsində kəmiyyət verilənlərinin analizi
  • 3 Analitik fəaliyyətlər
  • 4 Digər tətbiqlər
  • 5 Təcrübə qeydləri
  • 6 Pulsuz proqram təminatı
  • 7 Təkrarlana bilən analiz
  • 8 Məlumat analizi müsabiqələri
  • 9 İstinadlar
    • 9.1 Biblioqrafiya
  • 10 Əlavə ədəbiyyat

Verilənlərin analizi prosesi

 
Şutt və O'Nill (2013) tərəfindən Doing Data Science kitabından məlumat elmi prosesinin axın qrafiki

Verilənlərin analizi xam məlumatların əldə edilməsi və sonra onun istifadəçi qərarlarının qəbulu üçün faydalı məlumatlara çevrilməsi prosesidir. Statistik Con Tukey 1961-ci ildə məlumatların təhlilini belə təyin etmişdir:

"Verilənlərin analizi prosedurları, bu cür prosedurların nəticələrinin şərh edilməsi üsulları, təhlilin sadələşdirilməsi, dəqiqliyi və ya etibarlılığını artırmaq üçün məlumatların toplanmasının planlaşdırılması vasitələri və məlumatların təhlilinə tətbiq olunan (riyazi) statistikanın bütün aparatları və nəticələri."[7]

Sonrakı mərhələlərdən gələn rəylər əvvəlki mərhələlərdə əlavə işlərə səbəb olduğundan işlək mərhələlər mövcuddur.[8]

Verilənlərə tələblər

Verilənlərin təhlili prosesində ilkin addım mövcud və lazım olan məlumatların müəyyənləşdirilməsidir. Hər bir analitik tapşırıq üçün məlumatın növü, keyfiyyəti və həcmi öncədən müəyyən edilməlidir.[9] Doğru məlumatlar olmadan əldə ediləcək nəticələrin etibarlılığı zəif ola bilər. Analiz məqsədinə uyğun verilənlərin strukturu və mənbələri seçilir. Məlumatın həm kəmiyyət, həm də keyfiyyət aspektləri nəzərə alınmalıdır. Əlavə olaraq məlumatın etibarlılığı və yenilənmə tezliyi analiz nəticələrini birbaşa təsir edir. Tələb olunan verilənlərin mövcudluğu və çatışmazlığı risklərin qiymətləndirilməsinə kömək edir.[10] Verilənlərin formatı və saxlanma üsulu da prosesin səmərəliliyinə təsir göstərir. Həmçinin, məlumatların əldə olunması üçün hüquqi və etik tələblər də nəzərə alınmalıdır. Analiz üçün tələblər düzgün müəyyən edilmədikdə, məlumat toplama xərcləri artar və vaxt itirilə bilər. Mənbələrin etibarlılığı və müxtəlifliyi analiz nəticələrinin dəqiqliyini artırır. Məlumat tələbləri layihənin əvvəlində sənədləşdirilməli və tərəfdaşlarla razılaşdırılmalıdır. Nəticədə, düzgün verilənlər tələbləri analitik prosesin əsasını təşkil edir və qərarvermənin keyfiyyətini yüksəldir.[11]

Verilənlərin toplanması

Verilənlərin toplanması prosesi analiz üçün ilkin məlumatları toplamaq məqsədini daşıyır. Bu mərhələdə məlumat mənbələri müəyyənləşdirilir və seçim kriteriyaları tətbiq olunur. Toplama üsulları həm əl ilə, həm də avtomatlaşdırılmış sistemlərlə həyata keçirilə bilər. Məlumat həm birincil (ing. primary), həm də ikincil (ing. secondary) mənbələrdən əldə edilə bilər. Sorğular, müşahidələr, sensorlar və verilənlər bazaları ən çox istifadə olunan metodlardır. Toplama prosesi zamanı məlumatın dəqiqliyi və etibarlılığı diqqətlə qiymətləndirilir.[12] Zaman seriyaları və kütləvi verilənlər xüsusi texnologiyalar tələb edə bilər. Həmçinin məlumatın formatı və strukturlaşdırılması gələcək emal mərhələsinə uyğun olmalıdır. Analitik tələblərə cavab verən məlumat dəstləri seçilməlidir. Toplanmış məlumatın saxlanması və təhlükəsizliyi də vacibdir. Hüquqi və etik qaydalar çərçivəsində məlumatların istifadəsi təmin edilməlidir. Verilənlərin düzgün toplanması analizin keyfiyyətinə birbaşa təsir göstərir. Nəticədə, sistemli və planlı məlumat toplama layihənin uğurunu təmin edir.[13]

Verilənlərin emalı

Verilənlərin emalı toplu məlumatların analizə hazır vəziyyətə gətirilməsi prosesidir. Bu mərhələdə məlumatlar strukturlaşdırılır və uyğun formatlara çevrilir. Məlumatın müxtəlif mənbələrdən toplanması zamanı uyğunlaşdırma və inteqrasiya aparılır. Əlavə və ya zəruri olmayan məlumatlar təhlil üçün hazırlanır. Verilənlərin normalizasiyası və standardizasiyası statistik analiz üçün vacibdir. Zaman seriyaları və kütləvi verilənlər üçün xüsusi alqoritmlər istifadə olunur.[14] Məlumatların çevrilməsi avtomatlaşdırılmış skript və proqram təminatı ilə həyata keçirilə bilər. Mənbələr arasında fərqliliklərin aradan qaldırılması nəticələrin dəqiqliyini artırır. Həmçinin məlumatın məxfilik və təhlükəsizlik tələbləri təmin edilir. Verilənlərin emal prosesi modelin öyrənmə keyfiyyətini yüksəldir. Etibarlı emal nəticəsində analiz üçün lazımi göstəricilər çıxarılır. Bu mərhələ həm kəmiyyət, həm də keyfiyyət verilənləri üçün tətbiq olunur. Sonda, emal edilmiş məlumatlar növbəti təhlil mərhələsinə ötürülür.

Verilənlərin təmizlənməsi

Verilənlərin təmizlənməsi məlumat dəstindəki səhvləri, boş sahələri və uyğunsuzluqları aradan qaldırmaq prosesidir. Bu mərhələdə dublikatlar aşkarlanır və silinir. Uyğun olmayan və ya mənasız qeydlər düzəldilir. Əlavə olaraq, itkin məlumatlar üçün əvəzedici qiymətlər tətbiq oluna bilər. Statistik üsullar və proqram təminatı səhvlərin aşkarlanmasında kömək edir. Təmizlənmiş məlumat analizin dəqiqliyini artırır. Anomaliyalar və çıxıntı dəyərlər (ing. outliers) müəyyənləşdirilir və qiymətləndirilir. Səth səhvlərinin düzəldilməsi məlumatın keyfiyyətini yüksəldir.[15] Mənbələr arasındakı uyğunsuzluqlar da bu mərhələdə aradan qaldırılır.[16] Təmizlənmiş məlumat analitik model üçün etibarlı baza yaradır. Proses həm avtomatlaşdırıla, həm də əl ilə həyata keçirilə bilər. Təmizləmə mərhələsi layihənin səmərəliliyini birbaşa təsir edir. Nəticədə, verilənlərin təmizlənməsi analiz prosesinin əsas komponenti kimi çıxış edir.[17][18]

Kəşfiyyat xarakterli verilənlər analizi

Kəşfiyyat xarakterli verilənlər analizi (EDA) məlumat dəstini ilkin mərhələdə anlamağa və gizli strukturları aşkar etməyə yönəlir. Bu prosesdə analitik vizualizasiya, təsviri statistika və qrafik üsullardan istifadə olunur. EDA məlumatın paylanmasını, dəyişənlər arasındakı əlaqələri və mümkün anomaliyaları müəyyənləşdirir. Qrafiklər, histogramlar və qutu-diagramlar (boxplot) əsas vasitələrdəndir. Bu mərhələ model qurulmazdan əvvəl aparılır.[19][20] Əsas məqsəd məlumatın keyfiyyətini qiymətləndirmək və uyğun metodologiyanı seçməkdir. Korrelyasiya təhlili dəyişənlər arasındakı qarşılıqlı asılılıqları ortaya çıxarır. Həmçinin EDA analitik hipotezlərin formalaşdırılmasına kömək edir. Böyük həcmli verilənlərdə EDA xüsusi proqram təminatı və interaktiv panellər tələb edə bilər. Anomaliyaların aşkar edilməsi modelləşdirmə səhvlərini azaldır. EDA nəticələri daha dərin statistik modellərin qurulmasına istiqamət verir. Məlumatın strukturunun aydın təsviri qərarverməni asanlaşdırır. Bu səbəbdən EDA verilənlərin analizi prosesində kritik addım hesab olunur.[8]

Modelləşdirmə və alqoritmlər

Modelləşdirmə mərhələsi məlumatdan nəticə çıxarmaq və proqnoz vermək üçün statistik və riyazi strukturların qurulmasıdır. Bu prosesdə xətti və qeyri-xətti modellər geniş tətbiq olunur. Maşın öyrənməsi alqoritmləri, məsələn, təsnifat və reqressiya üsulları müasir təhlildə mühüm rol oynayır. Modelin seçimi verilənlərin növünə və analizin məqsədinə əsaslanır.[21] Parametrlərin optimallaşdırılması nəticələrin dəqiqliyini artırır. Modellərin treninq və test dəstlərində qiymətləndirilməsi tələb olunur. Çoxölçülü verilənlərdə ölçü azaldılması (dimensionality reduction) mühüm əhəmiyyət daşıyır. Modellər üzərində kross-validasiya aparmaq etibarlılığı təmin edir. Alqoritmik yanaşmalar real vaxt rejimində proqnoz verməyə imkan yaradır.[22] Həm statistik, həm də hesablama resurslarının balansı nəzərə alınmalıdır. Modelləşdirmə nəticələri vizualizasiya ilə dəstəklənir. Bu mərhələ verilənlərdən praktik tətbiqlər üçün istifadəni təmin edir. Sonda, düzgün qurulmuş modellər qərarvermə prosesinə elmi əsas verir.[23]

Verilənlər məhsulu

Verilənlər məhsulu məlumatın analiz nəticəsində əldə edilən praktik tətbiqidir. Bu məhsul istifadəçilərə konkret qərarlar vermək və əməliyyatları optimallaşdırmaq imkanı yaradır. Data product adətən interaktiv panellər, proqnozlaşdırıcı alətlər və ya tövsiyə sistemləri şəklində təqdim olunur. Bu mərhələdə analitik nəticələr biznes və idarəetmə proseslərinə inteqrasiya edilir. Məlumat məhsulları real vaxt rejimində yenilənə bilər.[24] İstifadəçi interfeysi məhsulun qəbul olunmasına təsir edən mühüm faktordur. Məhsulun dəqiqliyi və etibarlılığı əvvəlki analiz mərhələlərinin keyfiyyətindən asılıdır. Təhlükəsizlik və məxfilik prinsipləri burada da əsas rol oynayır. Verilənlər məhsulu təşkilatın strateji məqsədlərinə uyğun olmalıdır. Həmçinin məhsulun texniki dəstəyi və yenilənməsi planlaşdırılmalıdır. Bu cür məhsullar maliyyə, səhiyyə, logistika və digər sahələrdə geniş tətbiq tapır. Yüksək keyfiyyətli verilənlərin analizi analitik investisiyanın dəyərini artırır. Nəticədə, verilənlər məhsulu analiz prosesinin praktiki nəticəsini təcəssüm etdirir.[8][25]

Kommunikasiya

 
Verilənlərin vizuallaşdırılması verilənlər təhlil edildikdən sonra nəticələri başa düşməyə kömək etmək üçün istifadə olunur.[26]

Analiz nəticələrinin effektiv kommunikasiya olunması qərarvermə üçün əsas şərtdir. Bu mərhələdə məlumat qrafiklər, hesabatlar və təqdimatlar vasitəsilə təqdim edilir. Auditoriyanın texniki səviyyəsi nəzərə alınaraq məlumatın sadə və aydın formada çatdırılması vacibdir. Vizualizasiya alətləri məlumatın anlaşılmasını asanlaşdırır.[27] Əsas tapıntılar qısa və məzmunlu şəkildə vurğulanmalıdır. Rəqəmsal platformalar nəticələrin paylaşılmasını sürətləndirir. Həm yazılı, həm şifahi təqdimatlar burada mühüm əhəmiyyət kəsb edir. Analitik qruplar və maraqlı tərəflər arasında qarşılıqlı əlaqə qurulur. Kommunikasiya prosesi nəticələrin düzgün interpretasiyasını təmin edir. Qərarvericilərə əsas tövsiyələr təqdim olunmalıdır. Şəffaflıq və obyektivlik etimadı artırır. İstifadə olunan terminologiya auditoriyaya uyğun seçilməlidir.[28] Nəticədə, effektiv kommunikasiya analitik tapıntıların real dəyərə çevrilməsinə xidmət edir.

Kəmiyyət mesajları

 
Zamanla ABŞ federal xərcləri və gəlirlərindəki meylləri nümayiş etdirən xətt qrafiki ilə təsvir edilmiş zaman seriyası
 
Zaman nöqtələrində ölçülən iki dəyişən (inflyasiya və işsizlik) arasındakı əlaqəni göstərən səpələnmə qrafiki

Kəmiyyət mesajları verilənlərin ədədi nəticələrini dəqiq və anlaşılan şəkildə çatdırma üsuludur.[29] Bu mesajlar statistik göstəricilər və qrafik təsvirlərlə təqdim olunur. Auditoriyanın qərarvermə prosesində kəmiyyət əsaslı sübutlar mühüm rol oynayır. Rəqəmlər və faizlər məlumatın obyektivliyini artırır. Müqayisəli cədvəllər fərqli ssenarilərin təsirini göstərir. Məlumatların interval və paylanma göstəriciləri əsas arqumentləri dəstəkləyir.[30][31] Qrafik dizayn məlumatın yanlış interpretasiyasının qarşısını almalıdır. Hər kəmiyyət mesajı kontekst və məqsədlə uyğunlaşdırılır. Auditoriyanın diqqətini əsas nəticələrə yönəltmək üçün sadə vizuallar seçilir.[32] Kəmiyyət mesajları risk və üstünlükləri aydın göstərir.[33] Həddən artıq detal əsas məqamların itirilməsinə səbəb ola bilər. Məlumatların mənbələri və metodologiyası şəffaf təqdim edilməlidir. Beləliklə, kəmiyyət mesajları analizin obyektiv təsir gücünü artırır.[34]

Maliyyə sahəsində kəmiyyət verilənlərinin analizi

Maliyyə analizində kəmiyyət verilənləri risklərin qiymətləndirilməsi və proqnozların hazırlanması üçün əsasdır. Bu prosesdə bazar qiymətləri, faiz dərəcələri və maliyyə göstəriciləri təhlil olunur.[33] Statistik modellər gələcək bazar tendensiyalarını proqnozlaşdırmağa kömək edir. Vaxt sıraları analizi maliyyə bazarlarında geniş istifadə edilir. Regressiya və korrelyasiya üsulları aktivlərin qiymət dəyişkənliyini izah edir. Portfel optimallaşdırması risk və gəlir balansını təyin edir. Makroiqtisadi göstəricilər maliyyə qərarlarının əsasını təşkil edir. Böyük həcmli məlumatlar real vaxt rejimində analiz olunur.[35] Alqoritmik ticarət sistemləri avtomatik qərarlar qəbul etməyə imkan yaradır. Maliyyə modelləri investisiya strategiyalarını təkmilləşdirir. Qlobal maliyyə bazarlarının mürəkkəbliyi yüksək dəqiqlikli məlumat tələb edir. Risk idarəetmə alətləri potensial zərərləri azaldır. Bu metodlar maliyyə sabitliyinin qorunmasında həlledici rol oynayır.

Analitik fəaliyyətlər

Analitik fəaliyyətlər məlumatların toplanması, emalı və nəticələrin çıxarılması üçün ardıcıl addımları əhatə edir. Bu fəaliyyətlər tədqiqatın məqsədinə uyğun metodların seçilməsi ilə başlayır. Məlumatların ilkin emalı və təmizlənməsi keyfiyyətli nəticə əldə etmək üçün vacibdir. Növbəti mərhələdə statistik üsullar və modelləşdirmə texnikaları tətbiq olunur. Analitik fəaliyyətlər həm kəmiyyət, həm də keyfiyyət metodlarını birləşdirə bilər.[36]

Vizualizasiya və nəticələrin interpretasiyası bu prosesin ayrılmaz hissəsidir. Müasir analitik fəaliyyətlərdə avtomatlaşdırılmış alqoritmlərdən geniş istifadə olunur. Komanda işi və sahə üzrə ekspertiza düzgün nəticələr üçün əhəmiyyətlidir.[37][38][39] Analitik fəaliyyətlər qərarvermə mexanizmlərinə bilavasitə təsir göstərir. Etibarlılıq üçün metodoloji şəffaflıq qorunmalıdır. Hər addımda sənədləşdirmə aparılması təkrar istifadəni asanlaşdırır. Nəticələrin biznes, elm və dövlət idarəçiliyində praktik dəyəri olur. Bu fəaliyyətlər verilənlərə əsaslanan idarəetmənin əsasını təşkil edir.[40]

Digər tətbiqlər

Verilənlər analizi bir çox müxtəlif sahələrdə geniş tətbiq tapır. Səhiyyə sahəsində xəstəliklərin proqnozlaşdırılması və müalicə planlarının optimallaşdırılması üçün istifadə olunur. Təhsil sektorunda tələbə nailiyyətlərinin qiymətləndirilməsi və fərdi tədris proqramları hazırlanır. Kənd təsərrüfatında məhsuldarlığın artırılması məqsədilə hava və torpaq məlumatları analiz edilir. Nəqliyyat və logistika şirkətləri marşrut optimallaşdırılması üçün məlumat təhlilinə müraciət edirlər.[41] Enerji sektorunda istehlakın proqnozu və resursların bölüşdürülməsi aparılır. Maliyyə bazarlarında risklərin azaldılması üçün statistik modellər qurulur.

Marketinq sahəsində müştəri davranışları izlənir və təkliflər fərdiləşdirilir. Sosial elmlərdə sorğular və ictimai rəy araşdırmaları üçün istifadə olunur. Hökumət orqanları ictimai xidmətlərin planlaşdırılması və təkmilləşdirilməsi üçün məlumat təhlilindən yararlanır. Ətraf mühit monitorinqi iqlim dəyişikliyi risklərini qiymətləndirməyə kömək edir. Həmçinin mədəni irsin qorunması və rəqəmsallaşdırılmasında da verilənlər analizi mühüm rol oynayır.[42]

Təcrübə qeydləri

Təcrübə qeydləri məlumat analizinin real vəziyyətlərdə tətbiqini göstərən praktik nümunələrdir. Bu qeydlər metodologiyanın güclü və zəif tərəflərini üzə çıxarmağa kömək edir. Case study yanaşması müxtəlif sənaye sahələrində geniş istifadə olunur. Məsələn, pərakəndə satış şirkətlərində müştəri davranışları təhlil olunur.[43] Səhiyyə sahəsində xəstəxana resurslarının səmərəli idarə olunması üçün məlumatlar öyrənilir. Enerji sektorunda istehlak proqnozu üzrə təcrübə qeydləri aparılır. Hər təcrübə qeydi unikal məlumat mənbələri və xüsusi problemlərlə xarakterizə olunur. Nəticələr gələcək layihələr üçün dəyərli tövsiyələr təqdim edir. Təcrübə qeydləri akademik tədqiqatlar üçün də nümunə rolunu oynayır. Bu yanaşma nəzəriyyə ilə praktikanı birləşdirir. Real layihələrdə toplanan dərslər analitik bacarıqları inkişaf etdirir. Qeydlər həm də risklərin qiymətləndirilməsində köməkçi olur. Beləliklə, təcrübə qeydləri məlumat analizinin praktik dəyərini nümayiş etdirir.[44]

Pulsuz proqram təminatı

Pulsuz proqram təminatı verilənlərin analizi üçün əlçatan və iqtisadi cəhətdən sərfəli seçimdir. R proqramlaşdırma dili statistik modelləşdirmə və qrafik vizualizasiya üçün geniş istifadə olunur.[45] Python dili Pandas, NumPy və Matplotlib kimi kitabxanalarla populyardır. Julia dili yüksək hesablama gücü tələb edən layihələr üçün uyğundur. Jupyter Notebook interaktiv analiz və hesabat üçün çoxfunksiyalı mühit yaradır. PostgreSQL və MySQL kimi açıq mənbəli verilənlər bazaları böyük məlumatların idarəsini təmin edir. KNIME və Orange vizual iş axını ilə analitik prosesləri sadələşdirir. Apache Spark böyük həcmli məlumatların emalında yüksək performans göstərir.[46] QGIS coğrafi məlumatların analizi üçün geniş imkanlar verir. Bu proqramlar elmi tədqiqatlar və kommersiya layihələrində istifadə olunur. İstifadəçilər üçün aktiv icma dəstəyi və geniş sənədləşmə mövcuddur.[47] Pulsuz proqram təminatı innovasiyanın yayılmasına töhfə verir. Onların öyrənilməsi analitik bacarıqların artırılmasına şərait yaradır.

Təkrarlana bilən analiz

Təkrarlana bilən analiz eyni verilənlər və metodlarla aparıldıqda eyni nəticələrin əldə olunmasını təmin edir. Bu prinsip elmi tədqiqatların etibarlılığı üçün əsas şərtdir. Kodun və məlumatların tam sənədləşdirilməsi vacibdir. Versiya nəzarəti dəyişiklikləri izləməyə imkan verir. Açıq mənbəli alətlər şəffaflığı artırır.[48]

R Markdown və Jupyter Notebook kimi platformalar analiz addımlarının tam təkrarlanmasını asanlaşdırır. Standartlaşdırılmış prosedurlar nəticələrin müqayisəsini mümkün edir. Təkrarlana bilən analiz səhv və qərəz riskini azaldır. Bu yanaşma müxtəlif tədqiqatçılar arasında əməkdaşlığı gücləndirir. Akademik nəşrlər də bu prinsipi tələb edir. Həm nəzəri, həm də praktiki işlərdə keyfiyyət göstəricisi hesab olunur. Təkrarlanan nəticələr elmi biliklərin konsolidasiyasını sürətləndirir. Beləliklə, bu prinsip analitik tədqiqatın dayanıqlığını təmin edir.[49]

Məlumat analizi müsabiqələri

Məlumat analizi müsabiqələri analitiklərin bilik və bacarıqlarını sınamaq üçün təşkil olunur. Kaggle bu sahədə ən tanınmış platformalardan biridir. Müsabiqələr real biznes problemlərinə əsaslanır. İştirakçılar müxtəlif metodologiyalar və alqoritmlər tətbiq edərək həllər təklif edirlər. Bu yarışlar innovativ yanaşmaların inkişafını təşviq edir.[50] Komanda şəklində iştirak əməkdaşlıq bacarıqlarını artırır. Müsabiqələrdə yüksək dəqiqlik və optimallaşdırma əsas meyarlardır.[51]

Sponsor şirkətlər yeni istedadları aşkar etmək imkanı qazanır.[52] Təcrübəli mütəxəssislər üçün biliklərini yeniləmək şansı yaranır. Qalib layihələr praktiki tətbiqlərə çevrilə bilər. Bu yarışlar məlumat elmi sahəsində təcrübə toplamağa kömək edir. Onlar həmçinin elmi və kommersiya mühitini birləşdirir. Müsabiqələr nəticələrin açıq paylaşımını təşviq edərək bilik mübadiləsinə töhfə verir.[53]

İstinadlar

  1. ↑ Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. DOI:10.1108/BIJ-08-2012-0050
  2. ↑ "Transforming Unstructured Data into Useful Information", Big Data, Mining, and Analytics, Auerbach Publications, 227–246, 12 mart 2014, doi:10.1201/b16666-14, ISBN 978-0-429-09529-0, İstifadə tarixi: 29 may 2021
  3. ↑ "The Multiple Facets of Correlation Functions", Data Analysis Techniques for Physical Scientists, Cambridge University Press, 526–576, 2017, doi:10.1017/9781108241922.013, ISBN 978-1-108-41678-8, İstifadə tarixi: 29 may 2021
  4. ↑ "Data Coding and Exploratory Analysis (EDA) Rules for Data Coding Exploratory Data Analysis (EDA) Statistical Assumptions", SPSS for Intermediate Statistics, Routledge, 42–67, 16 avqust 2004, doi:10.4324/9781410611420-6, ISBN 978-1-4106-1142-0, İstifadə tarixi: 29 may 2021
  5. ↑ Samandar, Petersson; Svantesson, Sofia. Skapandet av förtroende inom eWOM : En studie av profilbildens effekt ur ett könsperspektiv. Högskolan i Gävle, Företagsekonomi. 2017. OCLC 1233454128.
  6. ↑ Goodnight, James. "The forecast for predictive analytics: hot and getting hotter". Statistical Analysis and Data Mining: The ASA Data Science Journal. 4 (1). 13 yanvar 2011: 9–10. doi:10.1002/sam.10106. ISSN 1932-1864.
  7. ↑ Tukey, John W. "John Tukey-The Future of Data Analysis-July 1961". The Annals of Mathematical Statistics. 33 (1). mart 1962: 1–67. doi:10.1214/aoms/1177704711. 26 yanvar 2020 tarixində arxivləşdirilib. İstifadə tarixi: 1 yanvar 2015.
  8. ↑ 1 2 3 Schutt, Rachel; O'Neil, Cathy. Doing Data Science. O'Reilly Media. 2013. ISBN 978-1-449-35865-5.
  9. ↑ Peleg, Roni; Avdalimov, Angelika; Freud, Tamar. "Providing cell phone numbers and email addresses to Patients: the physician's perspective". BMC Research Notes. 4 (1). 23 mart 2011: 76. doi:10.1186/1756-0500-4-76. ISSN 1756-0500. PMC 3076270. PMID 21426591.
  10. ↑ "USE OF THE DATA", Handbook of Petroleum Product Analysis, Hoboken, NJ: John Wiley & Sons, Inc, 296–303, 6 fevral 2015, doi:10.1002/9781118986370.ch18, ISBN 978-1-118-98637-0, İstifadə tarixi: 29 may 2021
  11. ↑ "Perceptual Edge-Jonathan Koomey-Best practices for understanding quantitative data-February 14, 2006" (PDF). 5 oktyabr 2014 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 12 noyabr 2014.
  12. ↑ MacPherson, Derek, "Information Technology Analysts' Perspectives", Data Strategy in Colleges and Universities, Routledge, 16 oktyabr 2019, 168–183, doi:10.4324/9780429437564-12, ISBN 978-0-429-43756-4, İstifadə tarixi: 29 may 2021
  13. ↑ Olusola, Johnson Adedeji; Shote, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. "Table 1: Data type and sources of data collected for this research". PeerJ. 9. 7 may 2021: e11387. doi:10.7717/peerj.11387/table-1.
  14. ↑ "FTC requests additional data". Pump Industry Analyst. 1999 (48): 12. dekabr 1999. doi:10.1016/s1359-6128(99)90509-8. ISSN 1359-6128.
  15. ↑ Bohannon, John. "Many surveys, about one in five, may contain fraudulent data". Science. 24 fevral 2016. doi:10.1126/science.aaf4104. ISSN 0036-8075.
  16. ↑ Hancock, R.G.V.; Carter, Tristan. "How reliable are our published archaeometric analyses? Effects of analytical techniques through time on the elemental analysis of obsidians". Journal of Archaeological Science. 37 (2). fevral 2010: 243–250. Bibcode:2010JArSc..37..243H. doi:10.1016/j.jas.2009.10.004. ISSN 0305-4403.
  17. ↑ "Data Cleaning". Microsoft Research. 29 oktyabr 2013 tarixində arxivləşdirilib. İstifadə tarixi: 26 oktyabr 2013.
  18. ↑ Hellerstein, Joseph. "Quantitative Data Cleaning for Large Databases" (PDF). EECS Computer Science Division. 27 fevral 2008: 3. 13 oktyabr 2013 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 26 oktyabr 2013.
  19. ↑ "Exploring your Data with Data Visualization & Descriptive Statistics: Common Descriptive Statistics for Quantitative Data". 2017. doi:10.4135/9781529732795.
  20. ↑ Murray, Daniel G. Tableau your data! : fast and easy visual analysis with Tableau Software. J. Wiley & Sons. 2013. ISBN 978-1-118-61204-0. OCLC 873810654.
  21. ↑ Evans, Michelle V.; Dallas, Tad A.; Han, Barbara A.; Murdock, Courtney C.; Drake, John M. Brady, Oliver (redaktor). "Figure 2. Variable importance by permutation, averaged over 25 models". eLife. 6. 28 fevral 2017: e22053. doi:10.7554/elife.22053.004.
  22. ↑ Watson, Kevin; Halperin, Israel; Aguilera-Castells, Joan; Iacono, Antonio Dello. "Table 3: Descriptive (mean ± SD), inferential (95% CI) and qualitative statistics (ES) of all variables between self-selected and predetermined conditions". PeerJ. 8. 12 noyabr 2020: e10361. doi:10.7717/peerj.10361/table-3.
  23. ↑ Nwabueze, JC. "Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal". Journal of the Nigerian Association of Mathematical Physics. 9 (1). 21 may 2008. doi:10.4314/jonamp.v9i1.40071. ISSN 1116-4336.
  24. ↑ Conway, Steve. "A Cautionary Note on Data Inputs and Visual Outputs in Social Network Analysis". British Journal of Management. 25 (1). 4 iyul 2012: 102–117. doi:10.1111/j.1467-8551.2012.00835.x. hdl:2381/36068. ISSN 1045-3172.
  25. ↑ "Customer Purchases and Other Repeated Events", Data Analysis Using SQL and Excel®, Indianapolis, Indiana: John Wiley & Sons, Inc., 367–420, 29 yanvar 2016, doi:10.1002/9781119183419.ch8, ISBN 978-1-119-18341-9, İstifadə tarixi: 31 may 2021
  26. ↑ Grandjean, Martin. "La connaissance est un réseau" (PDF). Les Cahiers du Numérique. 10 (3). 2014: 37–54. doi:10.3166/lcn.10.3.37-54. 27 sentyabr 2015 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 5 may 2015.
  27. ↑ Data requirements for semiconductor die. Exchange data formats and data dictionary, BSI British Standards, doi:10.3403/02271298, İstifadə tarixi: 31 may 2021
  28. ↑ Visualizing Data About UK Museums: Bar Charts, Line Charts and Heat Maps. 2021. doi:10.4135/9781529768749. ISBN 9781529768749.
  29. ↑ Garnier, Elodie M.; Fouret, Nastasia; Descoins, Médéric. "Table 2: Graph comparison between Scatter plot, Violin + Scatter plot, Heatmap and ViSiElse graph". PeerJ. 8. 3 fevral 2020: e8341. doi:10.7717/peerj.8341/table-2.
  30. ↑ "Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004" (PDF). 5 oktyabr 2014 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 29 oktyabr 2014.
  31. ↑ "Stephen Few-Perceptual Edge-Graph Selection Matrix" (PDF). 5 oktyabr 2014 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 29 oktyabr 2014.
  32. ↑ Swamidass, P. M. X-Bar Chart // Encyclopedia of Production and Manufacturing Management. 2000. səh. 841. doi:10.1007/1-4020-0612-8_1063. ISBN 978-0-7923-8630-8.
  33. ↑ 1 2 "Product comparison chart: Wearables". PsycEXTRA Dataset. 2009. doi:10.1037/e539162010-006. İstifadə tarixi: 3 iyun 2021.
  34. ↑ "Chart C5.3. Percentage of 15-19 year-olds not in education, by labour market status (2012)". doi:10.1787/888933119055. İstifadə tarixi: 3 iyun 2021.
  35. ↑ "Chart 7: Households: final consumption expenditure versus actual individual consumption". doi:10.1787/665527077310. İstifadə tarixi: 3 iyun 2021.
  36. ↑ Feinmann, Jane. "How Can Engineers and Journalists Help Each Other?" (Video). The Institute of Engineering & Technology. doi:10.1049/iet-tv.48.859. İstifadə tarixi: 3 iyun 2021.
  37. ↑ Robert Amar, James Eagan, and John Stasko (2005) "Low-Level Components of Analytic Activity in Information Visualization" Arxivləşdirilib 2015-02-13 at the Wayback Machine
  38. ↑ William Newman (1994) "A Preliminary Analysis of the Products of HCI Research, Using Pro Forma Abstracts" Arxivləşdirilib 2016-03-03 at the Wayback Machine
  39. ↑ Mary Shaw (2002) "What Makes Good Research in Software Engineering?" Arxivləşdirilib 2018-11-05 at the Wayback Machine
  40. ↑ Dul, Jan. "Necessary Condition Analysis (NCA): Logic and Methodology of 'Necessary But Not Sufficient' Causality". SSRN Electronic Journal. 2015. doi:10.2139/ssrn.2588480. hdl:1765/77890. ISSN 1556-5068.
  41. ↑ "Connectivity tool transfers data among database and statistical products". Computational Statistics & Data Analysis. 8 (2): 224. iyul 1989. doi:10.1016/0167-9473(89)90021-2. ISSN 0167-9473.
  42. ↑ "Information relevant to your job", Obtaining Information for Effective Management, Routledge, 48–54, 11 iyul 2007, doi:10.4324/9780080544304-16 (inactive 1 iyul 2025), ISBN 978-0-08-054430-4, İstifadə tarixi: 3 iyun 2021
  43. ↑ Gordon, Roger. "Do Publicly Traded Corporations Act in the Public Interest?". National Bureau of Economic Research Working Papers. Cambridge, MA. mart 1990. doi:10.3386/w3303.
  44. ↑ Rivard, Jillian R. Confirmation bias in witness interviewing: Can interviewers ignore their preconceptions? (Tezis). Florida International University. 2014. doi:10.25148/etd.fi14071109.
  45. ↑ Papineau, David, "Does the Sociology of Science Discredit Science?", Relativism and Realism in Science, Dordrecht: Springer Netherlands, 1988, 37–57, doi:10.1007/978-94-009-2877-0_2, ISBN 978-94-010-7795-8, İstifadə tarixi: 3 iyun 2021
  46. ↑ Bromme, Rainer; Hesse, Friedrich W.; Spada, Hans, redaktorlar Barriers and Biases in Computer-Mediated Knowledge Communication. 2005. doi:10.1007/b105100. ISBN 978-0-387-24317-7.
  47. ↑ Heuer, Richards. Heuer, Richards J (redaktor). Quantitative Approaches to Political Intelligence. 10 iyun 2019. doi:10.4324/9780429303647. ISBN 9780429303647.
  48. ↑ "Introduction" (PDF). Central Intelligence Agency. 25 oktyabr 2021 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 25 oktyabr 2021.
  49. ↑ "Figure 6.7. Differences in literacy scores across OECD countries generally mirror those in numeracy". doi:10.1787/888934081549. İstifadə tarixi: 3 iyun 2021.
  50. ↑ Ritholz, Barry. "Bad Math that Passes for Insight". Bloomberg View. 29 oktyabr 2014 tarixində orijinalından arxivləşdirilib. İstifadə tarixi: 29 oktyabr 2014.
  51. ↑ Taura, Toshiharu; Nagai, Yukari. Comparing Nominal Groups to Real Teams // Design Creativity 2010. London: Springer-Verlag London. 2011. 165–171. ISBN 978-0-85729-223-0.
  52. ↑ "25. General government total outlays". doi:10.1787/888932348795. İstifadə tarixi: 3 iyun 2021.
  53. ↑ Gross, William H. "Coupon Valuation and Interest Rate Cycles". Financial Analysts Journal. 35 (4). iyul 1979: 68–71. doi:10.2469/faj.v35.n4.68. ISSN 0015-198X.

Biblioqrafiya

  • Adèr, Herman J. Chapter 14: Phases and initial steps in data analysis // Adèr, Herman J.; Mellenbergh, Gideon J.; Hand, David J (redaktorlar ). Advising on research methods : a consultant's companion. Huizen, Netherlands: Johannes van Kessel Pub. 2008a. 333–356. ISBN 9789079418015. OCLC 905799857.
  • Adèr, Herman J. Chapter 15: The main analysis phase // Adèr, Herman J.; Mellenbergh, Gideon J.; Hand, David J (redaktorlar ). Advising on research methods : a consultant's companion. Huizen, Netherlands: Johannes van Kessel Pub. 2008b. 357–386. ISBN 9789079418015. OCLC 905799857.
  • Tabachnick, B.G. & Fidell, L.S. (2007). Chapter 4: Cleaning up your act. Screening data prior to analysis. In B.G. Tabachnick & L.S. Fidell (Eds.), Using Multivariate Statistics, Fifth Edition (pp. 60–116). Boston: Pearson Education, Inc. / Allyn and Bacon.

Əlavə ədəbiyyat

  • Adèr, H.J. & Gideon J. Mellenbergh(with contributions by D.J. Hand) (2008). Advising on Research Methods: A Consultant's Companion. Huizen, the Netherlands: Johannes van Kessel Publishing. ISBN 978-90-79418-01-5
  • Chambers, John M.; Cleveland, William S.; Kleiner, Beat; Tukey, Paul A. (1983). Graphical Methods for Data Analysis, Wadsworth/Duxbury Press. ISBN 0-534-98052-X
  • Fandango, Armando (2017). Python Data Analysis, 2nd Edition. Packt Publishers. ISBN 978-1787127487
  • Juran, Joseph M.; Godfrey, A. Blanton (1999). Juran's Quality Handbook, 5th Edition. New York: McGraw Hill. ISBN 0-07-034003-X
  • Lewis-Beck, Michael S. (1995). Data Analysis: an Introduction, Sage Publications Inc, ISBN 0-8039-5772-6
  • NIST/SEMATECH (2008) Handbook of Statistical Methods
  • Pyzdek, T, (2003). Quality Engineering Handbook, ISBN 0-8247-4614-7
  • Richard Veryard (1984). Pragmatic Data Analysis. Oxford : Blackwell Scientific Publications. ISBN 0-632-01311-7
  • Tabachnick, B.G.; Fidell, L.S. (2007). Using Multivariate Statistics, 5th Edition. Boston: Pearson Education, Inc. / Allyn and Bacon, ISBN 978-0-205-45938-4
Mənbə — "https://az.wikipedia.org/w/index.php?title=Verilənlərin_analizi&oldid=8333622"
Informasiya Melumat Axtar