[추천시스템] Collaborative Filtering (ALS를 중심으로)
안녕하세요! 이번 포스팅은 지난 포스팅에 이어 협업 필터링 기반 추천 알고리즘을 알아보도록 하겠습니다. 코드 실습에는 Last.fm에서 제공하는 2010년 미국 spotify 데이터를 활용하도록 하겠습니다. note: 용량이 1.5GB 정도로 꽤 크기 때문에 코드만 참고하셔도 좋습니다 [협업 필터링(Collaborative Filtering) ...
안녕하세요! 이번 포스팅은 지난 포스팅에 이어 협업 필터링 기반 추천 알고리즘을 알아보도록 하겠습니다. 코드 실습에는 Last.fm에서 제공하는 2010년 미국 spotify 데이터를 활용하도록 하겠습니다. note: 용량이 1.5GB 정도로 꽤 크기 때문에 코드만 참고하셔도 좋습니다 [협업 필터링(Collaborative Filtering) ...
안녕하세요. 이번 포스팅에서는 머신러닝을 활용한 추천 시스템에 대해 알아보도록 하겠습니다. 추천 시스템에 대한 간단한 이론부터 딥러닝 기반의 실습까지 여러 포스팅에 거쳐, 가능한 쉽게❗ 설명해보도록 하겠습니다. 추천 시스템이란? 인스타그램, 유튜브, 넷플릭스 혹은 쿠팡과 같은 커머스까지, 하나쯤은 이용해보신 경험이 있을거라 생각합니다. 인스타...
안녕하세요! 지난 포스팅에서는 ARIMA 그리고 SARIMA 모델을 활용한 모델링과 예측까지의 과정을 다루었습니다. ARIMA 란? 이번 글에서는 시계열의 또 다른 중요한 특성인 변동성(Volatility), 즉 분산의 시각적 변화를 다루는 ARCH/GARCH 모델과, 이후 발전된 딥러닝 기반 시계열 예측 접근법을 알아보도록 하겠습니다. 이번에는 ...
지난 포스팅에서는 시계열 데이터의 정상성(Stationarity)과 전처리 과정을 다루었습니다. 이번 글에서는 이렇게 정제된 데이터를 활용하여 실제로 예측에 많이 쓰이는 ARIMA 계열 모델과 ARCH/GARCH 모델, 그리고 최신 딥러닝 기반 접근법까지 간단히 살펴보겠습니다. 지난 포스팅에서 다룬 Airpassengers data를 그대로 사용합니...
안녕하세요, 행복한 휴가를 보냈더니 밀린 글이 많습니다… 머신러닝 관련 포스팅도 천천히 작성해보겠습니다. 이번 포스팅은 시계열(Time Series) 데이터를 처음 접하는 분들을 위한 내용이며, 1편과 2편으로 나누어져 있습니다. 1편에서는 정상성과 전처리를 다루고 있고, 2편에서는 모델링과 평가에 대해 설명할 예정입니다. 여유가 된다면 사례 분석도...
안녕하세요. 이번 글에서는 지난 아주 쉬운 통계학 1에 이어, 통계 분석에서 중요한 가설검정(Hypothesis Testing) 과 다양한 비교 방법에 대해 다루도록 하겠습니다. 1. 가설검정의 기본 개념 정의 p-value(유의확률)를 계산하여, 귀무가설을 기각할지 여부를 판단하는 절차입니다. ‘p-value’ 란? 귀무가설이 참이...
안녕하세요. 데이터 분석은 정량적이고 객관적으로 사건에 접근하는 가장 유효한 수단 중 하나입니다. 데이터 분석을 통해 재현 가능한 신뢰성 높은 증거를 얻거나 미래의 상태를 예측할 수 있으므로, 데이터 분석은 많은 연구 분야에서 필수로 사용되고 있습니다. 데이터 분석 방법에는 여러 가지가 있으나 대부분이 통계학을 기초로 하고 있습니다. 이번 포스팅에...
국가공인 SQL 개발자 자격시험 안녕하세요, 부트캠프 SQL 과정을 마치자마자 마침 올라와 있던 SQLD 시험을 지원하게 됐습니다! 데이터 관련 일을 준비하다보면 쉽게 접할 수 있는 SQL 자격증.. 저도 준비하게 됐습니다. 오늘은 SQLD 시험이 어떤 것인지, 어떻게 공부해야할지?에 대해 한 번 정리해볼게요. 1. SQLD란? SQLD는 한국...
SQL 기초 가이드 안녕하세요, SQL을 처음 접하시는 분들을 위해 자주 사용하는 문법과 개념을 정리해보았습니다. 1. SQL 실행 순서 SQL 쿼리는 일반적으로 WITH, SELECT, FROM, WHERE, GROUP BY, HAVING, ORDER BY, LIMIT 순으로 작성되지만, 실제 실행 순서와는 차이가 있습니다. FROM &g...
Using SQL with pandasql and BigQuery This guide shows how to run SQL queries in two powerful environments: Python’s pandasql for in-memory DataFrame querying Google BigQuery for cloud-scale d...