کلان داده ها -فناوریهایجمع آوری داده
کلان داده ها
نگاهی به آینده فناوری اطلاعات و ارتباطات
فناوریهای جمع آوری داده
والمارت در یک ساعت یک میلیون تراکنش مربوط به مشتریان را انجام میدهد.
فیس بوک ۴۰ میلیارد عکس از کاربران را ذخیره کرده است. و روزانه ۱۰ ترابایت داده تولید می کند.
رمزگشایی ژنوم انسانی ۱۰ سال طول می کشید اما امروزه یک هفته انجام می شود.
برای شرکتهای حوزه فاوا:
تولید ابزارهای جمع اوری منابع داده ای
تولید و توسعه ابزارها و نرم افزار های انباره داده
استفاده از داده های جمع آوری شده برای ارائه خدمات ارزش افزوده
امکان بهره برداری عادلانه از منابع داده ای موجود
تکمیل اکو سیستم ابزارهای تولید، جمع آوری و پردازش کلان داده ها
کلان داده فناوری جمع آوری داده
برای شرکتهای تجاری و تولیدی:
استخراج دانش از منابع داده ای
شناسایی سلایق بازار و مشتریان
افزایش میزان فروش و بازارسازی
برای سازمانها:
پردازش داده های مدیریت شهری و شهر هوشمند
پردازش و مدیریت داده های مور نیاز در مدیریت بحران و پیشگیری از حوادث
استخراج دانش از داده های پراکنده و غیر ساخت یافته
امکان تجمیع داده های متنوع و پراکنده
امکان شناسایی نواقص داده های موجوئ
امکان ایجاد پنجره واحد خدمات شهری
کلان داده ها
شناسایی دارایی های اطلاعاتی سازمانها
اعتماد بیشتر به نتایج پروژه های داده کاوی
سازمانهای کلیدی در حوزه تولید و پردازش:
شهرداری یزد و سایر شهرداری های استان
سازمان فاوای شهرداری
اداره کل ارتباطات و فناوری اطلاعات
شرکت گاز استان
شرکت توزیع برق استان
شرکت آب و فاضلاب استان
شرکت مخابرات
اداره کل ثبت احوال استان
اداره کل ثبت اسناد و املاک استان
اداره کل پدافند غیر عامل استانداری
پیشگویی آینده فن آوری
در کره زمین توسط کرزوایل
هدست های واقعیت مجازی کاربران را در دنیایی مصنوعی فرو می برد و هدست واقعیت افزوده، اشیا و محیط دنیای واقعی را با هم ادغام می کند
آینده از آن کسانی است که به استقبالش می روند . فردریش نیچه
Storing Big Data
Analyzing your data characteristics
Selecting data sources for analysis
Eliminating redundant data
Establishing the role of NoSQL
Overview of Big Data stores
Data models: key value, graph, document, column-family
Hadoop Distributed File System
HBase
Hive
کلان داده ها
Types of tools used in Big-Data
Where processing is hosted?
Distributed Servers / Cloud (e.g. Amazon EC2)
Where data is stored?
Distributed Storage (e.g. Amazon S3)
What is the programming model?
Distributed Processing (e.g. MapReduce)
How data is stored & indexed?
High-performance schema-free databases (e.g. MongoDB)
What operations are performed on data?
Analytic / Semantic Processing