첫 번째 실험실
>> A/B test
1. A/B test 란?
A/B test에 대한 개념부터 짚어보자.
[그로스 해킹_양승화] 05. 성장 실험 : A/B 테스트
[그로스 해킹_양승화] 01. 그로스 해킹이란?해당 글은 위키북스의 그로스 해킹(양승화 지음)을 읽고 정리한 내용입니다. 그로스 해킹 | 양승화 - 교보문고그로스 해킹 | 그로스 해킹에 대한 실용
seheehee.tistory.com
2. 실험 계기
최근 tistory를 시작하며 들었던 의문이 한 가지 있다. 사람들은 pandas와 같은 IT 용어를 작성할 때 한글을 많이 사용할까, 영어를 더 많이 사용할까?
사실, pandas와 같이 상당히 많이 사용하는 용어들은 '판다스'라고 한글로 표기하는 것이 어색하지 않다. 한편으로는, 라이브러리를 서치 할 때 영어로 검색해야 더 자료가 많다는 사실을 익히 알고 있다.
이 두 가지의 선택지 중에 어떤 선택지를 많이 선택하는지 궁금했고, tistory 게시글을 이용해 알아보고자 했다. pandas와 같은 '라이브러리 명'을 한글로 표기했을 때와 영어로 표기했을 때 어떤 게시글의 유입이 더 많은지 확인을 통해 가설을 검증하려 한다.
3. 실험 설계
▶ 가설 : 무엇을 확인하고 싶은가?
💡 " 판다스와 같이 한글이 익숙한 라이브러리명은 한글 표기를 더 많이 사용할 것이다 " 💡
즉, 한글 표기를 사용한 게시글의 조회수가 더 높을 것이다.
▶ 실험 집단 / 통제 집단 : 실험 조건에 할당되는 사용자들
- 검색어 유입 수
▶ 독립변수 : 인과 관계에서 "원인"이 되는 변수
- 'pandas', 'numpy' 영문 표기
- '판다스', '넘파이' 한글 표기
▶ 종속 변수 : 인과 관계에서 "결과"가 되는 변수
- tistory 누적 조회수
▶ 통제 변수 : 실험 집단/통제 집단 모두에서 동등한 조건을 가져야 하는 변수
- 독립변수 이외의 모든 텍스트
- 글의 구성 및 첨부 이미지
- 해시태그의 개수와 배치
▶ 샘플 크기 : 실험 참가자의 숫자
- tistory 방문객 (미정)
▶ 실험 기간 : 가설 검증을 위한 데이터 수집 기간
- 24. 06. 13 ~ 24. 09. 13
▶ 순차 테스트와 동시 테스트 여부
- 동시 테스트 진행
4. 실험 과정
▶ tistory 게시글 발생 후 조회수 비교
Pandas와 Numpy 비교하기
1. Pandas✅ Index를 내가 원하는 대로 컨트롤할 수 있는 library1차원 Series 형으로 data type 변경 조건에 맞는 데이터 뽑기Series index 값 확인 Series value 값 확인 Series에 조건이 있는지 확인하기 결측치
seheehee.tistory.com
판다스와 넘파이 비교하기
1. 판다스✅ 인덱스를 내가 원하는 대로 컨트롤할 수 있는 라이브러리1차원 시리즈 형으로 데이터타입 변경 조건에 맞는 데이터 뽑기시리즈 인덱스 값 확인 시리즈 밸류 값 확인 시리즈에 조
seheehee.tistory.com
'데이터 분석' 카테고리의 다른 글
[EDA] Heatmap, 데이터 패턴과 관계 파악하기 (0) | 2025.02.26 |
---|---|
Pandas와 Numpy 비교하기 (0) | 2024.06.13 |
판다스와 넘파이 비교하기 (0) | 2024.06.13 |
DB Schema (0) | 2024.04.23 |
KPI (2) - 어떻게 하는건데? (0) | 2024.04.19 |