데이터
-
[데이터 분석] 데이터의 5V데이터/데이터 분석 2025. 1. 15. 22:53
데이터의 5V는 빅데이터(Big Data)의 핵심 특성을 설명하는 다섯 가지 요소입니다. 이 특성들은 데이터를 이해하고 분석하며 처리하는 데 중요한 기준을 제공합니다. 데이터의 5V 1. Volume (데이터 양):• 데이터의 크기 또는 양을 의미합니다. • 빅데이터는 전통적인 데이터 관리 시스템으로는 처리하기 어려울 정도로 방대한 데이터를 포함합니다. • 예: 소셜 미디어 게시물, 센서 데이터, 스트리밍 데이터 등. 2. Velocity (데이터 속도): • 데이터 생성, 수집, 저장, 처리의 속도를 의미합니다. • 현대 시스템은 초당 수백만 개의 트랜잭션 데이터를 실시간으로 처리해야 합니다. • 예: 실시간 주식 거래 데이터, IoT 장치 데이터 등. 3. Variety (데이터 다양성): • 데..
-
[Python] Google Colab 단축키 모음데이터/데이터 과학 2025. 1. 13. 13:06
Colab 단축키 정리Mac은 ctrl 대신 commend 자주쓰는 단축키셀 실행Shift + Enter셀 추가 (아래)Ctrl + M + B셀 삭제Ctrl + M + D셀 타입 변경 (코드)Ctrl + M + Y셀 타입 변경 (텍스트, 마크다운)Ctrl + M + M셀에서 주석 달기/해제Ctrl + /출력 숨기기/보이기Ctrl + M + O자동 완성Tab 나머지 단축키셀 실행Shift + Enter셀 실행 및 다음 셀 선택Alt + Enter셀 실행 후 포커스 유지Ctrl + Enter셀 추가 (아래)Ctrl + M + B셀 추가 (위)Ctrl + M + A셀 삭제Ctrl + M + D셀 복제Ctrl + M + C셀 이동 (위로)Ctrl + M + K셀 이동 (아래로)Ctrl + M + J셀 타입 변..
-
[Numpy] 난수로 배열만들기데이터/데이터 과학 2024. 12. 12. 00:24
1. 정규분포(평균 0, 분산 1)를 따르는 난수 10개 발생import numpy.random as random#정규분포(평균0, 분산1)을 따르는 난수 10개 발생rnd_data1 = random.randn(10)print(rnd_data1) 2. 1000 ~ 5000 사이의 균등 분포 난수 10개 발생# 1000 ~ 5000 사이의 균등 분포 난수 10개 발생rnd_data2 = random.uniform(1000,5000,10)print(rnd_data2) random.seed(0)를 추가하면 난수 결과값이 고정되어 바뀌지 않는다.안의 숫자는 난수 생성에 영향을 주지만 큰 의미 없어서 고정할 때만 사용하면 될 것 같다.보통 0, 42로 생성함. 반대로 random.seed(0)을 선언하지 않으..
-
[Numpy] 넘파이 기초데이터/데이터 과학 2024. 12. 12. 00:19
1. 배열 생성data = np.array([1,3,2,4,5,6,7,9,8,10])data 2. 데이터 형data.dtype data.dtype : 객체의 dtype 속성 확인 3. 차원과 원소수import numpy as npimport numpy.random as randomdata = np.array([1,3,2,4,5,6,7,9,8,10])print(data.ndim)print(data.size) data.ndim : 배열의 차원 확인data.size : 배열의 원소 수 확인 4. 기본 정렬 (오름차순)data = np.array([3,1,2,4,8,6,10,9,5,7])#현재 값 그대로 표시print(data) #정렬data.sort()#정렬 후 array 출력print(data) da..
-
그로쓰 해킹(Growth Hacking) 이란?데이터/데이터 분석 2024. 12. 11. 11:56
1. 그로쓰 해킹의 정의“Growth”: 성장“Hacking”: 비전통적이거나 창의적인 접근 방식→ 즉, 기존의 마케팅 방식에서 벗어나 데이터와 실험을 통해 빠르고 효율적인 성장을 도모하는 것을 의미한다. 2. 그로쓰 해킹의 특징데이터 기반:데이터 분석을 통해 고객 행동을 이해하고, 전략을 수립.어떤 요소가 고객 전환율(Conversion Rate)을 높이는지 정량적으로 파악.실험과 반복:작은 규모의 실험(A/B 테스트)을 반복하여 가장 효과적인 방법을 발견.실패를 두려워하지 않고 빠르게 수정하여 최적화.다양한 기술 활용:코딩, 자동화 도구, 분석 툴 등을 적극적으로 활용.마케팅과 기술의 융합.비용 효율성:적은 자원으로 최대의 성과를 추구. 3. 주요 단계그로스 해킹은 보통 AARRR 프레임워크(Pira..
-
퍼널 분석이란?데이터/데이터 분석 2024. 12. 11. 11:47
1. 퍼널의 구조퍼널은 위는 넓고 아래는 좁은 깔때기 모양으로 표현되며, 각 단계마다 사용자 수가 점차 줄어드는 것을 나타냅니다. 예를 들어, 광고를 본 모든 사람 중 일부만 웹사이트에 방문하고, 그중 일부만 상품을 구매하는 방식으로 진행됩니다. 2. 일반적인 퍼널의 단계사용자 행동 흐름에 따라 아래와 같이 나뉩니다: 1. Awareness (인지): 브랜드나 제품에 대해 알게 되는 단계. 2. Interest (관심): 제품이나 서비스에 관심을 가지는 단계. 3. Consideration (고려): 구매나 가입 등을 진지하게 고민하는 단계. 4. Action (행동): 구매, 회원가입, 다운로드 등 최종 목표 행동을 하는 단계. 3. 퍼널의 활용퍼널은 사용자 전환율을 분석하는 데 중요한 도구입니다. 이..