Böyük verilənlər (ing. big data) — ənənəvi məlumat emalı proqramı ilə idarə oluna bilməyəcək qədər böyük və ya mürəkkəb verilənlər dəstləri. Çoxlu daxiletməsi (sətir) olan məlumatlar daha böyük statistik güc təklif edir, halbuki daha yüksək mürəkkəbliyə malik məlumatlar (daha çox atribut və ya sütun) daha yüksək yanlış aşkaretmə dərəcəsinə səbəb ola bilər. Rəsmi tərifin olmaması səbəbindən bəzən sərbəst şəkildə istifadə olunsa da, ən yaxşı şərh odur ki, o, yalnız kiçik miqdarda istifadə edildikdə dərk edilə bilməyən böyük bir məlumat toplusudur.

Rəqəmsal qlobal məlumat saxlama qabiliyyətinin qeyri-xətti artımı və analoq yaddaşın azalması

Böyük verilənlərin təhlili ilə bağlı problemlərə məlumatların toplanması, saxlanması, təhlili, axtarış, paylaşma, ötürmə, vizuallaşdırma, sorğulama, yeniləmə, məlumat məxfiliyi və məlumat mənbələri daxildir. Böyük verilənlər əvvəlcə üç əsas anlayışla əlaqələndirildi: həcm, müxtəlifliksürət. Böyük məlumatların təhlili seçmə zamanı çətinliklər yaradır və bu səbəbdən, əvvəlcə yalnız müşahidələrə və seçmələrə imkan verir. Beləliklə, dördüncü anlayış, doğruluq, məlumatların keyfiyyətinə və ya dərinliyinə aiddir. Böyük verilənlərin doğruluğu üçün ekspertizaya kifayət qədər sərmayə qoyulmadan, məlumatların həcmi və müxtəlifliyi təşkilatın böyük verilənlərdən dəyər yaratmaq və əldə etmək imkanlarını aşan xərclər və risklər yarada bilər.

Böyük verilənlər termininin cari istifadəsi proqnozlaşdırıcı analitika, istifadəçi davranışının analitikası və ya böyük verilənlərdən dəyər çıxaran digər müəyyən qabaqcıl məlumat analitikası metodlarının istifadəsinə, nadir hallarda isə məlumat dəstinin müəyyən ölçüsünə aiddir. "Hazırda mövcud olan məlumatların miqdarının həqiqətən böyük olduğuna şübhə yoxdur, lakin bu, bu yeni məlumat ekosisteminin ən aktual xüsusiyyəti deyil." Məlumat dəstlərinin təhlili "biznes meyllərini aşkar etmək, xəstəliklərin qarşısını almaq, cinayətlə mübarizə və s." üçün yeni korrelyasiya tapa bilər. Alimlər, biznes rəhbərləri, həkimlər, reklamlar və hökumətlər müntəzəm olaraq internet axtarışları, fintech, səhiyyə analitikası, coğrafi informasiya sistemləri, şəhər informatikası və biznes informatikası da daxil olmaqla böyük məlumat dəstləri ilə bağlı çətinliklərlə üzləşirlər. Alimlər meteorologiya, genomika,, mürəkkəb fizika simulyasiyaları, biologiya və ətraf mühit tədqiqatları daxil olmaqla e-elm işində məhdudiyyətlərlə qarşılaşırlar. Mobil cihazlar, ucuz və çoxsaylı məlumat aşkar edən əşyaların interneti cihazları, antenna, proqram qeydləri, kameralar, mikrofonlar, radiotezlik identifikasiya oxuyucuları və simsiz sensor şəbəkələr kimi cihazlar tərəfindən toplandığı üçün mövcud məlumat dəstlərinin ölçüsü və sayı sürətlə artmışdır. Dünyada adambaşına düşən texnoloji məlumat saxlamaq qabiliyyəti 1980-ci illərdən bəri hər 40 ayda təxminən iki dəfə artmışdır. 2012-ci ildən etibarən hər gün 2,5 ekzabayt (2,17×260 bayt) məlumat yaradılır. Beynəlxalq Verilənlər Korporasiyasının (BVK) hesabat proqnozuna əsasən, qlobal məlumat həcminin 2013–2020-ci illər arasında 4,4 zettabaytdan 44 zettabaytadək artacağı proqnozlaşdırılır. 2025-ci ilə qədər BVK 163 zettabayt məlumat olacağını proqnozlaşdırır. BVK-nin məlumatına görə, 2021-ci ildə böyük verilənlər və biznes analitikası (BDA) həllərinin qlobal xərclərinin 215,7 milyard dollara çatacağı təxmin edilir. Lakin Statista təşkilatı qlobal böyük məlumat bazarının 2027-ci ilə qədər 103 milyard dollara qədər artacağını proqnozlaşdırır. 2011-ci ildə bildirdi ki, əgər ABŞ səhiyyəsi səmərəliliyi və keyfiyyəti artırmaq üçün böyük məlumatlardan yaradıcı və effektiv istifadə etsə, sektor hər il 300 milyard dollardan çox dəyər yarada bilər. Avropanın inkişaf etmiş iqtisadiyyatlarında hökumət idarəçiləri böyük verilənlərdən istifadə etməklə təkcə əməliyyat səmərəliliyinin artırılmasına 100 milyard avrodan (149 milyard dollar) çox qənaət edə bilərdilər. Şəxsi məkan məlumatları ilə aktivləşdirilən xidmətlərin istifadəçiləri isə 600 milyard dollar istehlakçı profisiti əldə edə bilər. Böyük müəssisələr üçün problem bütün təşkilata təsir edən böyük məlumat təşəbbüslərinin kimə məxsus olduğunu müəyyən etməkdir.

Verilənlərin vizuallaşdırılması üçün istifadə olunan relyasiyalı verilənlər bazası idarəetmə sistemləri və masaüstü statistik proqram paketləri çox vaxt böyük verilənləri emal etmək və təhlil etməkdə çətinlik çəkirlər. Böyük verilənlərin emalı və təhlili "onlarla, yüzlərlə və hətta minlərlə serverdə işləyən kütləvi paralel proqram təminatı" tələb edə bilər. "Böyük verilənlər" kimi təsnif edilənlər onu təhlil edənlərin imkanlarından və alətlərindən asılı olaraq dəyişir. Bundan əlavə, genişlənən imkanlar böyük verilənləri hərəkətli hədəfə çevirir. "Bəzi təşkilatlar üçün ilk dəfə yüzlərlə giqabayt verilənlərlə qarşılaşmaq məlumatların idarə edilməsi variantlarına yenidən baxmağa ehtiyac yarada bilər. Digərləri üçün verilənlərin ölçüsünün əhəmiyyətli bir məsələyə çevrilməsi onlarla və ya yüzlərlə terabayt çəkə bilər."

Xarakteristika

 
Bu şəkil böyük verilənlərin həcm, sürət və müxtəliflik kimi əsas xüsusiyyətlərinin artımını göstərir.

Böyük verilənlər dedikdə "həcmi mövcud üsul və sistemlərin imkanlarını ötüb keçən verilənlər" təsəvvür edilir. "Böyük" məfhumu mövcud hesablama səviyyəsinə görə nisbidir. Massaçusets Texnologiya İnstitutunun professoru S. Madden "böyük verilənlər"i "çox böyük", "çox sürətli", "çox çətin" kimi təsvir edir. Burada "çox çətin" ifadəsi mövcud alətlərlə emal oluna bilməyən verilənlərə aiddir. Stuart Ward və Adam Barker bu ideyaları ümumiləşdirərək böyük verilənləri böyük və ya mürəkkəb verilənlər dəstinin saxlanması və analizi NoSQL, MapReduce, maşın təlimi ilə məhdudlaşmayan bir sıra üsulların köməyi ilə təsvir edilən termin kimi təyin etmişlər. Göründüyü kimi, BV-nin anlaşılmasında 3V modelini daha çox istifadə olunan və geniş yayılmış tərif kimi qəbul etmək olar. Çünki bu model uyğun texnologiyaməhsullara olan tələbləri əldə etmək üçün Böyük verilənləri daha yaxşı xarakterizə edir.

Virtuallaşdırma

Data virtuallaşdırma bir yerdə çox mənbələrdən məlumat toplamaq üçün bir yoldur. Assambleya virtualdır: Digər metodlardan fərqli olaraq, məlumatların əksəriyyəti mənşə yerində qalır və tələb olunan xammal mənbələrindən əldə edilir.

İstinadlar

  1. Hilbert, Martin; López, Priscila. . Science. 332 (6025). 2011: 60–65. Bibcode:. doi:. PMID . 14 April 2016 tarixində . İstifadə tarixi: 13 April 2016.
  2. Breur, Tom. "Statistical Power Analysis and the contemporary "crisis" in social sciences". Journal of Marketing Analytics. London, England: Palgrave Macmillan. 4 (2–3). July 2016: 61–65. doi:. ISSN .
  3. Mahdavi-Damghani, Babak. (DPhil thesis). Oxford, England: University of Oxford. 2019. səh. 21. SSRN  (). 2023-03-30 tarixində . İstifadə tarixi: 2023-12-26.
  4. . Watson Health Perspectives (ingilis). 2016-09-17. 18 January 2021 tarixində . İstifadə tarixi: 2021-01-20.
  5. Cappa, Francesco; Oriani, Raffaele; Peruffo, Enzo; McCarthy, Ian. . Journal of Product Innovation Management (ingilis). 38 (1). 2021: 49–67. doi:. ISSN . 2023-07-06 tarixində . İstifadə tarixi: 2023-12-26.
  6. boyd, dana; Crawford, Kate. . Social Science Research Network: A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society. 21 September 2011. doi:. 28 February 2020 tarixində . İstifadə tarixi: 12 July 2019.
  7. . The Economist. 25 February 2010. 27 May 2018 tarixində . İstifadə tarixi: 9 December 2012.
  8. "Community cleverness required". Nature. 455 (7209): 1. September 2008. Bibcode:. doi:. PMID .
  9. Reichman OJ, Jones MB, Schildhauer MP. . Science. 331 (6018). February 2011: 703–5. Bibcode:. doi:. PMID . 19 October 2020 tarixində . İstifadə tarixi: 12 July 2019.
  10. Hellerstein, Joe. . Gigaom Blog. 9 November 2008. 7 October 2012 tarixində . İstifadə tarixi: 21 April 2010.
  11. Segaran, Toby; Hammerbacher, Jeff. . O'Reilly Media. 2009. səh. 257. ISBN 978-0-596-15711-1. 12 May 2016 tarixində . İstifadə tarixi: 31 December 2015.
  12. Hilbert M, López P. (PDF). Science. 332 (6025). April 2011: 60–5. Bibcode:. doi:. PMID . 19 August 2019 tarixində (PDF). İstifadə tarixi: 11 May 2019.
  13. . ibm.com. 24 August 2013 tarixində . İstifadə tarixi: 26 August 2013.
  14. Reinsel, David; Gantz, John; Rydning, John. (PDF). seagate.com. Framingham, MA, US: . 13 April 2017. 8 December 2017 tarixində (PDF). İstifadə tarixi: 2 November 2017.
  15. . 23 July 2022 tarixində arxivləşdirilib. İstifadə tarixi: 31 July 2022.
  16. . 2022-07-20 tarixində . İstifadə tarixi: 2023-12-26.
  17. . 2023-08-02 tarixində . İstifadə tarixi: 2023-12-26.
  18. (PDF). McKinsey Global Institute. may 2011. 2023-03-15 tarixində (PDF). İstifadə tarixi: 2023-12-26.
  19. Oracle; FSN. (PDF). dekabr 2012. 31 mart 2020 tarixində (PDF).
  20. Jacobs, A. . ACMQueue. 6 July 2009. 8 December 2015 tarixində . İstifadə tarixi: 21 April 2010.
  21. Magoulas, Roger; Lorica, Ben. . Release 2.0. Sebastopol, CA: O'Reilly Media (11). February 2009. 2 November 2021 tarixində . İstifadə tarixi: 26 February 2021.
  22. Madden S. From Databases to Big Data // IEEE Internet Computing, 2012, vol.16, issue 3, pp.4–6
  23. Witt D., Gray J. Parallel Database Systems: The Future of High Performance Database Systems // Communications of the ACM, 1992, 35(6), pp. 85–98
  24. Laney D. 3D Data Management: Controlling Data Volume, Velocity and Variety. Technical report, META Group, Inc (now Gartner, Inc.), February 2001. 2020-09-28 at the Wayback Machine
  25. Ward J. S. and Barker A. Undefined By Data: A Survey of Big Data Definitions. 2022-06-19 at the Wayback Machine
  26. . 2018-04-10 tarixində arxivləşdirilib. İstifadə tarixi: 2018-05-03.

Ədəbiyyat

  • Hilbert, M, , Development Policy Review, 34 (1), 2016: 135–74, doi:, 1 June 2022 tarixində ; , 21 aprel 2021 at the Wayback Machine
  • Snijders, C.; Matzat, U.; Reips, U.-D. . International Journal of Internet Science. 7. 2012: 1–5. 23 November 2019 tarixində . İstifadə tarixi: 13 April 2013.
  • Yanase, J; Triantaphyllou, E. "A Systematic Survey of Computer-Aided Diagnosis in Medicine: Past and Present Developments". Expert Systems with Applications. 138. 2019: 112821. doi:.

Əlavə ədəbiyyat

  • Peter Kinnaird; Inbal Talgam-Cohen, redaktorlar . . 19 cild no. 1. Association for Computing Machinery. 2012. ISSN . OCLC .
  • ; ; . . Cambridge University Press. 2014. ISBN 978-1-10707723-2. OCLC .
  • ; . . Houghton Mifflin Harcourt. 2013. ISBN 978-1-29990302-9. OCLC .
  • Press, Gil. . forbes.com. Jersey City, NJ. 9 May 2013. İstifadə tarixi: 17 September 2016.
  • Stephens-Davidowitz, Seth. Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are. Dey Street Books. 2017. ISBN 978-0-06239085-1.
  • . Harvard Business Review. October 2012.
  • O'Neil, Cathy. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Broadway Books. 2017. ISBN 978-0-55341883-5.

Xarici keçidlər

  • — 4sim.gov.az
Mənbə — ""

Informasiya Melumat Axtar

Anarim.Az

Sayt Rehberliyi ile Elaqe

Saytdan Istifade Qaydalari

Anarim.Az 2004-2023