제너럴리스트를 위한 최고의 데이터 과학 서적 10권 및 설명 목록

Jeneoleolliseuteuleul Wihan Choegoui Deiteo Gwahag Seojeog 10gwon Mich Seolmyeong Moglog



데이터 사이언스는 과학적 방법, 프로세스, 알고리즘 및 시스템을 사용하여 방대한 양의 데이터를 처리하여 보이지 않는 패턴을 찾고, 의미 있는 정보를 도출하고, 기업에서 비즈니스 의사 결정을 내리고, 비기업 기관에서도 사용하는 연구 분야입니다. 비사업 기관에는 의료, 게임, 이미지 인식, 추천 시스템, 물류, 사기 탐지(은행 및 금융 기관), 인터넷 검색, 음성 인식, 표적 광고, 항공 노선 계획 및 증강 현실 산업이 포함됩니다. 데이터 과학은 인공 지능의 하위 집합입니다. 분석에 사용되는 데이터는 다양한 소스에서 가져올 수 있으며 다양한 형식으로 제공됩니다. 일부 소스 데이터는 표준화될 수 있습니다. 다른 것들은 표준화되지 않을 수 있습니다.

달리 말하면, 데이터를 수집하는 데 다른 방법론이 사용됩니다(데이텀의 복수형). 그런 다음 수집된 데이터에서 지식(가치 있는 결론)을 추출합니다. 그 과정에서 데이터가 모인 후에는 그 데이터(데이터)를 조사하여 문제를 해결하는 새로운 데이터(결과)를 얻는다.







(전공) 학문으로서의 데이터 과학은 대학의 학사 및 석사 학위 수준에 존재합니다. 그러나 전 세계적으로 학사 또는 석사 학위에서 데이터 과학을 제공하는 대학은 거의 없습니다. 학사 학위 수준에서 학생은 데이터 과학 학위를 받고 졸업합니다. 이것은 범용 학위와 같습니다. 석사 학위 수준에서 학생은 데이터 분석, 데이터 엔지니어링 또는 데이터 과학자를 전문으로 하는 데이터 과학 대학원 학위를 취득합니다.



기계 학습, 모델링, 통계, 프로그래밍 및 데이터베이스가 그 자체로 존경받는 대학 과정이고, 학사 학위 수준 또는 석사 수준의 다른 분야. 그럼에도 불구하고 학생이 학위 수준에서 데이터 과학을 공부하기 위해 대학에 진학할 때 이러한 모든 과정은 데이터 과학에 대한 적절한 과정과 함께 또는 그 전에 계속 공부하게 됩니다.



학사 학위를 위한 데이터 과학 또는 데이터 분석, 데이터 엔지니어링 또는 데이터 과학자와 같은 전문 분야는 아직 개발 중입니다. (대학에서) 공부한 후 산업에 적용하는 단계에 이르렀지만. 데이터 과학은 전반적으로 비교적 매우 새로운 분야입니다.





스페셜리스트가 되기 전에 먼저 제너럴리스트가 되어야 한다는 것을 기억하십시오. 전문가 프로그램 간의 차이점은 아직 명확하지 않습니다. 제너럴리스트와 스페셜리스트 프로그램의 구분은 아직 명확하지 않습니다.

데이터 과학은 비교적 새로운 분야이기 때문에 이 문서에 규정된 책은 교육학(책이 얼마나 잘 가르치는지)이 아닌 내용 범위를 기반으로 합니다. 그리고 그들은 학사 학위(제너럴리스트) 프로그램을 위한 것입니다. 다양한 제너럴리스트 과정이 있습니다.



목록

자세한 내용과 신용 카드로 가능한 구매에 대해서는 각 책에 대한 하이퍼링크가 제공됩니다. 모든 일반 과정을 다루는 책은 없습니다.

데이터 과학을 위한 필수 수학: 미적분, 통계, 확률 이론 및 선형 대수학

각본: 하드리안 진

  • 출판사: Hadrien Jean
  • 게시 날짜: 2020년 9월 30일 이후
  • 언어: 영어
  • 페이지 수: 400 이상

이 책의 내용은 데이터 사이언스를 위한 수학 강의라고 볼 수 있다. 데이터 사이언스를 혼자 배우는 것을 권장하지는 않지만, 데이터 사이언스를 혼자 배우고 싶은 고졸자는 이 책으로 시작해야 한다.

내용: 미적분; 통계 및 확률; 선형 대수; 스칼라 및 벡터 행렬과 텐서 스팬, 선형 종속성 및 공간 변환 선형 방정식 시스템; 고유벡터 및 고유값 특이값 분해.

https://www.essentialmathfordatascience.com/

데이터 구조 및 알고리즘에 대한 상식적인 가이드: 핵심 프로그래밍 기술 수준 향상 / 2판

저자: 제이 웬그로우

  • 출판사: 실용적인 책장
  • 게시일: 2020년 9월 15일
  • 언어: 영어
  • 치수: 7.5 x 1.25 x 9.25인치
  • 페이지 수: 508

이 책은 데이터 사이언스에서 사용되는 알고리즘과 데이터 구조를 다룬다. 누군가가 고등학교를 졸업하고 혼자 Data Science를 배우고 있다고 가정하면, 이전 수학 책을 읽고 다음으로 읽을 책입니다. 예제 프로그램은 JavaScript, Python 및 Ruby로 제공됩니다.

내용: 데이터 구조가 중요한 이유 알고리즘이 중요한 이유 오 예! 빅오 표기법; Big O로 코드 속도 향상 Big O를 사용하거나 사용하지 않고 코드 최적화 낙관적 시나리오를 위한 최적화 일상 코드의 Big O; 해시 테이블을 사용한 빠른 검색 스택과 큐로 우아한 코드 만들기 재귀를 통한 재귀 재귀; 재귀 쓰기 학습; 동적 프로그래밍; 속도를 위한 재귀 알고리즘 노드 기반 데이터 구조 이진 검색 트리로 모든 작업 속도 향상 힙으로 우선순위를 바로잡기; 시도해도 아프지 않습니다. 모든 것을 그래프로 연결하기; 공간 제약 처리 코드 최적화 기술

똑똑한 데이터 과학: 엔터프라이즈급 데이터 및 AI 프로젝트로 성공하기 / 1 편집

각본: Neal Fishman, Cole Stryker, Grady Booch

  • 출판사: 와일리
  • 게시일: 2020년 4월 14일
  • 언어: 영어
  • 페이지 수: 286

내용: AI 사다리 오르기; 프레이밍 파트 I: AI를 사용하는 조직에 대한 고려 사항 프레이밍 파트 II: 데이터 및 AI 작업 시 고려 사항 분석에 대한 회고: 하나 이상의 망치; 분석에 대한 전망: 모든 것이 못이 될 수 있는 것은 아닙니다. AI Ladder에서 운영 원칙 다루기 데이터 사용 극대화: 가치 주도 통계 분석을 통한 데이터 가치 평가 및 의미 있는 액세스 가능 장기적으로 건설; 여정의 끝: AI를 위한 IA.

머신 러닝: 확률론적 관점(적응 컴퓨팅 및 머신 러닝 시리즈) 일러스트 에디션

작성자: Kevin P. Murphy

  • 출판사: MIT 프레스
  • 게시일: 2012년 8월 24일
  • 언어: 영어
  • 치수: 8.25 x 1.79 x 9.27인치
  • 페이지 수: 1104

이 책은 초보자에게 좋습니다. 다시 말하지만, 이 문서에 규정된 나머지 모든 책과 마찬가지로 이 책은 불행히도 아직 확정되지 않은 제너럴리스트 프로그램에 필요한 모든 것을 다루지는 않습니다(전문 프로그램도 아직 확정되지 않았습니다). 여기에서 전형적인 초보자는 수학과 컴퓨터 과학에 합격한 고등학교 졸업자입니다.

내용: 소개(머신 러닝: 무엇과 왜?, 비지도 학습, 머신 러닝의 일부 기본 개념); 개연성; 불연속 데이터를 위한 생성 모델 가우시안 모델; 베이지안 통계; 빈도 통계; 선형 회귀; 로지스틱 회귀; 일반화 선형 모델 및 지수군; 유도 그래픽 모델(Bayes nets); 혼합 모델 및 EM 알고리즘 잠재 선형 모델 스파스 선형 모델 커널; 가우시안 프로세스; 적응형 기초 함수 모델 Markov 및 숨겨진 Markov 모델 상태 공간 모델 무향 그래픽 모델(Markov 랜덤 필드); 그래픽 모델에 대한 정확한 추론 변이추론; 더 다양한 추론; 몬테카를로 추론; MCMC(Markov chain Monte Carlo) 추론; 클러스터링 그래픽 모델 구조 학습; 불연속 데이터에 대한 잠재 변수 모델 딥 러닝.

비즈니스를 위한 데이터 과학: 데이터 마이닝 및 데이터 분석적 사고에 대해 알아야 할 사항 / 1판

각본: Tom Fawcett 및 Foster Provost

  • 출판사: 오라일리 미디어
  • 게시일: 2013년 9월 17일
  • 언어: 영어
  • 치수: 7 x 0.9 x 9.19인치
  • 페이지 수: 413

내용: 데이터 분석적 사고; 비즈니스 문제 및 데이터 과학 솔루션 예측 모델링 소개: 상관 관계에서 지도 세분화까지; 데이터에 모델 맞추기 과적합과 회피 유사성, 이웃 및 클러스터; 의사결정 분석적 사고 I: 좋은 모델이란?; 모델 성능 시각화 증거 및 개연성; 텍스트 표현 및 마이닝 의사결정 분석적 사고 II: 분석 공학을 향하여; 기타 데이터 과학 작업 및 기술 데이터 과학 및 비즈니스 전략; 결론.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

데이터 과학자를 위한 실용 통계: R 및 Python을 사용한 50개 이상의 필수 개념 / 제2판

각본: Peter Bruce, Andrew Bruce, Peter Gedeck

  • 출판사: 오라일리 미디어
  • 게시일: 2020년 6월 2일
  • 언어: 영어
  • 치수: 7 x 0.9 x 9.1인치
  • 페이지 수: 368

내용: 탐색적 데이터 분석, 데이터 및 샘플링 분포, 통계적 실험 및 유의성 테스트, 회귀 및 예측, 분류, 통계적 기계 학습, 자율 학습.

Why의 책: 원인과 결과에 대한 새로운 과학

각본: 쥬디아 펄, 다나 매켄지

  • 출판사: 베이직 북
  • 게시일: 2018년 5월 15일
  • 언어: 영어
  • 치수: 6.3 x 1.4 x 9.4인치
  • 페이지 수: 432

많은 데이터 사이언스 책이 일러스트레이션을 위해 순수한 비즈니스 산업을 사용하는 반면, 이 책은 일러스트레이션을 위해 의료 산업 및 기타 분야를 사용합니다.

내용: 소개: 데이터보다 마음; 인과 관계의 사다리; 해적에서 기니피그까지: 인과 추론의 창세기; 증거에서 원인으로: Bayes 목사가 Holmes 씨를 만납니다. 혼란과 혼란 해소: 또는 숨어 있는 변수 죽이기; 연기로 가득 찬 토론: 공기 정화; Paradoxes Galore!; 조정을 넘어서: 마운트 개입의 정복; Counterfactuals: 존재할 수 있었던 광업 세계; 중재: 메커니즘 찾기; 빅 데이터, 인공 지능 및 빅 질문.

데이터 과학 분야에서 경력 쌓기

각본: 에밀리 로빈슨, 재클린 놀리스

  • 출판사: 매닝
  • 게시일: 2020년 3월 24일
  • 언어: 영어
  • 치수: 7.38 x 0.8 x 9.25인치
  • 페이지 수: 354

내용: 데이터 과학 시작하기; 데이터 과학 직업 찾기 데이터 과학에 정착; 데이터 과학 역할에서 성장합니다.

https://www.manning.com/books/build-a-career-in-data-science

초보자를 위한 데이터 과학 / 제2판

각본: 릴리안 피어슨

  • 출판사: For Dummies
  • 게시일: 2017년 3월 6일
  • 언어: 영어
  • 치수: 7.3 x 1 x 9인치
  • 페이지 수: 384

이 책은 독자가 이미 수학 및 프로그래밍에 필요한 사전 지식을 가지고 있다고 가정합니다.

내용: 데이터 과학에 대한 이해; 데이터 엔지니어링 파이프라인 및 인프라 탐색 데이터 기반 통찰력을 비즈니스 및 산업에 적용 기계 학습: 기계로 데이터로부터 학습 수학, 확률 및 통계적 모델링 클러스터링을 사용하여 데이터 세분화 인스턴스를 사용한 모델링 사물 인터넷 장치를 작동하는 모델 구축 데이터 시각화 디자인의 원칙을 따르십시오. 데이터 시각화에 D3.js 사용 시각화 디자인을 위한 웹 기반 애플리케이션 대시보드 디자인의 모범 사례 탐색 공간 데이터로 지도 만들기 데이터 과학에 Python 사용 데이터 과학에 오픈 소스 R 사용 데이터 과학에서 SQL 사용 Excel 및 Knime으로 데이터 과학 수행 저널리즘의 데이터 과학: 5W(및 H) 고정; 환경 데이터 과학 탐구 전자 상거래의 성장을 주도하는 데이터 과학; 데이터 과학을 사용하여 범죄 활동을 설명하고 예측합니다. 오픈 데이터를 위한 10가지 경이로운 리소스 10가지 무료 데이터 과학 도구 및 애플리케이션.

대규모 데이터 세트 마이닝 / 3 편집

각본: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • 출판사: Cambridge University Press
  • 게시일: 2020년 2월 13일
  • 언어: 영어
  • 치수: 7 x 1 x 9.75인치
  • 페이지 수: 565

또한 이 책은 독자가 이미 수학과 프로그래밍에 필요한 사전 지식을 가지고 있다고 가정합니다.

내용: 데이터 마이닝; 맵리듀스와 새로운 소프트웨어 스택 MapReduce를 사용한 알고리즘; 유사 항목 찾기; 마이닝 데이터 스트림 링크 분석; 빈번한 항목 집합; 클러스터링 웹 광고; 추천 시스템; 마이닝 소셜 네트워크 그래프; 차원 축소; 대규모 기계 학습.

결론

전문가 프로그램 간의 차이점은 아직 명확하지 않습니다. 제너럴리스트와 스페셜리스트 프로그램의 구분도 아직 명확하지 않습니다. 그러나 주어진 책 목록을 읽은 후 독자는 데이터 분석가, 데이터 엔지니어링 및 데이터 과학자의 특별한 역할을 더 잘 인식하고 앞으로 나아갈 수 있습니다.