عنوان

Data-intensive systems :

پدید آورنده

Tomasz Wiktorski.

موضوع

Apache Hadoop.,Spark (Electronic resource : Apache Software Foundation),Apache Hadoop.,Spark (Electronic resource : Apache Software Foundation),Big data.,Databases.,Big data.,Databases.

رده

QA76
.
9
.
D32

W55

2019

کتابخانه

مرکز و کتابخانه مطالعات اسلامی به زبان‌های اروپایی

محل استقرار

استان: قم ـ شهر: قم

تماس با کتابخانه : 32910706-025

شابک

3030046036

شابک

3030046044

شابک

9783030046033

شابک

9783030046040

شابک اشتباه

3030046028

شابک اشتباه

9783030046026

عنوان و نام پديدآور

عنوان اصلي

Data-intensive systems :

نام عام مواد

[Book]

ساير اطلاعات عنواني

principles and fundamentals using Hadoop and Spark /

نام نخستين پديدآور

Tomasz Wiktorski.

وضعیت نشر و پخش و غیره

محل نشرو پخش و غیره

Cham, Switzerland :

نام ناشر، پخش کننده و غيره

Springer,

تاریخ نشرو بخش و غیره

[2019]

مشخصات ظاهری

نام خاص و کميت اثر

1 online resource

فروست

عنوان فروست

Advanced information and knowledge processing

یادداشتهای مربوط به کتابنامه ، واژه نامه و نمایه های داخل اثر

متن يادداشت

Includes bibliographical references.

یادداشتهای مربوط به مندرجات

متن يادداشت

Intro; Contents; List of Figures; List of Listings; 1 Preface; 1.1 Conventions Used in this Book; 1.2 Listed Code; 1.3 Terminology; 1.4 Examples and Exercises; 2 Introduction; 2.1 Growing Datasets; 2.2 Hardware Trends; 2.3 The V's of Big Data; 2.4 NOSQL; 2.5 Data as the Fourth Paradigm of Science; 2.6 Example Applications; 2.6.1 Data Hub; 2.6.2 Search and Recommendations; 2.6.3 Retail Optimization; 2.6.4 Healthcare; 2.6.5 Internet of Things; 2.7 Main Tools; 2.7.1 Hadoop; 2.7.2 Spark; 2.8 Exercises; References; 3 Hadoop 101 and Reference Scenario; 3.1 Reference Scenario; 3.2 Hadoop Setup

متن يادداشت

3.3 Analyzing Unstructured Data3.4 Analyzing Structured Data; 3.5 Exercises; 4 Functional Abstraction; 4.1 Functional Programming Overview; 4.2 Functional Abstraction for Data Processing; 4.3 Functional Abstraction and Parallelism; 4.4 Lambda Architecture; 4.5 Exercises; Reference; 5 Introduction to MapReduce; 5.1 Reference Code; 5.2 Map Phase; 5.3 Combine Phase; 5.4 Shuffle Phase; 5.5 Reduce Phase; 5.6 Embarrassingly Parallel Problems; 5.7 Running MapReduce Programs; 5.8 Exercises; 6 Hadoop Architecture; 6.1 Architecture Overview; 6.2 Data Handling; 6.2.1 HDFS Architecture; 6.2.2 Read Flow

متن يادداشت

6.2.3 Write Flow6.2.4 HDFS Failovers; 6.3 Job Handling; 6.3.1 Job Flow; 6.3.2 Data Locality; 6.3.3 Job and Task Failures; 6.4 Exercises; 7 MapReduce Algorithms and Patterns; 7.1 Counting, Summing, and Averaging; 7.2 Search Assist; 7.3 Random Sampling; 7.4 Multiline Input; 7.5 Inverted Index; 7.6 Exercises; References; 8 NOSQL Databases; 8.1 NOSQL Overview and Examples; 8.1.1 CAP and PACELC Theorem; 8.2 HBase Overview; 8.3 Data Model; 8.4 Architecture; 8.4.1 Regions; 8.4.2 HFile, HLog, and Memstore; 8.4.3 Region Server Failover; 8.5 MapReduce and HBase; 8.5.1 Loading Data

متن يادداشت

8.5.2 Running Queries8.6 Exercises; References; 9 Spark; 9.1 Motivation; 9.2 Data Model; 9.2.1 Resilient Distributed Datasets and DataFrames; 9.2.2 Other Data Structures; 9.3 Programming Model; 9.3.1 Data Ingestion; 9.3.2 Basic Actions-Count, Take, and Collect; 9.3.3 Basic Transformations-Filter, Map, and reduceByKey; 9.3.4 Other Operations-flatMap and Reduce; 9.4 Architecture; 9.5 SparkSQL; 9.6 Exercises

بدون عنوان

یادداشتهای مربوط به خلاصه یا چکیده

متن يادداشت

Data-intensive systems are a technological building block supporting Big Data and Data Science applications. This book familiarizes readers with core concepts that they should be aware of before continuing with independent work and the more advanced technical reference literature that dominates the current landscape. The material in the book is structured following a problem-based approach. This means that the content in the chapters is focused on developing solutions to simplified, but still realistic problems using data-intensive technologies and approaches. The reader follows one reference scenario through the whole book, that uses an open Apache dataset. The origins of this volume are in lectures from a master?s course in Data-intensive Systems, given at the University of Stavanger. Some chapters were also a base for guest lectures at Purdue University and Lodz University of Technology.

یادداشتهای مربوط به سفارشات

منبع سفارش / آدرس اشتراک

Springer Nature

شماره انبار

com.springer.onix.9783030046033

ویراست دیگر از اثر در قالب دیگر رسانه

عنوان

Data-intensive systems.

شماره استاندارد بين المللي کتاب و موسيقي

9783030046026

عنوان به منزله موضوع

موضوع مستند نشده

Apache Hadoop.

موضوع مستند نشده

Spark (Electronic resource : Apache Software Foundation)

موضوع مستند نشده

Apache Hadoop.

موضوع مستند نشده

Spark (Electronic resource : Apache Software Foundation)

موضوع (اسم عام یاعبارت اسمی عام)

موضوع مستند نشده

Big data.

موضوع مستند نشده

Databases.

موضوع مستند نشده

Big data.

موضوع مستند نشده

Databases.

مقوله موضوعی

موضوع مستند نشده

COM021000

موضوع مستند نشده

UMT

موضوع مستند نشده

رده بندی ديویی

شماره

005

ويراست

رده بندی کنگره

شماره رده

QA76

D32

نشانه اثر

W55

2019

نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )

مستند نام اشخاص تاييد نشده

Wiktorski, Tomasz

مبدا اصلی

تاريخ عمليات

20200823080735.0

قواعد فهرست نويسي ( بخش توصيفي )

دسترسی و محل الکترونیکی

نام الکترونيکي

اطلاعات رکورد کتابشناسی

نوع ماده

[Book]

اطلاعات دسترسی رکورد

تكميل شده

عنوان Data-intensive systems :

پدید آورنده Tomasz Wiktorski.

موضوع Apache Hadoop.,Spark (Electronic resource : Apache Software Foundation),Apache Hadoop.,Spark (Electronic resource : Apache Software Foundation),Big data.,Databases.,Big data.,Databases.

رده QA76.9.D32 W55 2019

کتابخانه مرکز و کتابخانه مطالعات اسلامی به زبان‌های اروپایی

محل استقرار استان: قم ـ شهر: قم

شابک

عنوان و نام پديدآور

وضعیت نشر و پخش و غیره

مشخصات ظاهری

فروست

یادداشتهای مربوط به کتابنامه ، واژه نامه و نمایه های داخل اثر

یادداشتهای مربوط به مندرجات

یادداشتهای مربوط به خلاصه یا چکیده

یادداشتهای مربوط به سفارشات

ویراست دیگر از اثر در قالب دیگر رسانه

عنوان به منزله موضوع

موضوع (اسم عام یاعبارت اسمی عام)

مقوله موضوعی

رده بندی ديویی

رده بندی کنگره

نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )

مبدا اصلی

دسترسی و محل الکترونیکی

اطلاعات رکورد کتابشناسی

اطلاعات دسترسی رکورد

عنوان

Data-intensive systems :

پدید آورنده

Tomasz Wiktorski.

موضوع

Apache Hadoop.,Spark (Electronic resource : Apache Software Foundation),Apache Hadoop.,Spark (Electronic resource : Apache Software Foundation),Big data.,Databases.,Big data.,Databases.

رده

QA76
.
9
.
D32

W55

2019

کتابخانه

مرکز و کتابخانه مطالعات اسلامی به زبان‌های اروپایی

محل استقرار

استان: قم ـ شهر: قم