데이터 분석

[실험실. 01] 아주 간단한 A/B test

셈뇽 2024. 7. 8. 19:59
첫 번째 실험실
>> A/B test

 

1. A/B test 란?

A/B test에 대한 개념부터 짚어보자.

 

[그로스 해킹_양승화] 05. 성장 실험 : A/B 테스트

[그로스 해킹_양승화] 01. 그로스 해킹이란?해당 글은 위키북스의 그로스 해킹(양승화 지음)을 읽고 정리한 내용입니다. 그로스 해킹 | 양승화 - 교보문고그로스 해킹 | 그로스 해킹에 대한 실용

seheehee.tistory.com

 

2. 실험 계기

최근 tistory를 시작하며 들었던 의문이 한 가지 있다. 사람들은 pandas와 같은 IT 용어를 작성할 때 한글을 많이 사용할까, 영어를 더 많이 사용할까? 

 

사실, pandas와 같이 상당히 많이 사용하는 용어들은 '판다스'라고 한글로 표기하는 것이 어색하지 않다. 한편으로는, 라이브러리를 서치 할 때 영어로 검색해야 더 자료가 많다는 사실을 익히 알고 있다.

 

이 두 가지의 선택지 중에 어떤 선택지를 많이 선택하는지 궁금했고, tistory 게시글을 이용해 알아보고자 했다. pandas와 같은  '라이브러리 명'을 한글로 표기했을 때와 영어로 표기했을 때 어떤 게시글의 유입이 더 많은지 확인을 통해 가설을 검증하려 한다.

 

3. 실험 설계


▶ 가설 : 무엇을 확인하고 싶은가?

💡 " 판다스와 같이 한글이 익숙한 라이브러리명은 한글 표기를 더 많이 사용할 것이다 " 💡

즉, 한글 표기를 사용한 게시글의 조회수가 더 높을 것이다.

 

▶ 실험 집단 / 통제 집단 : 실험 조건에 할당되는 사용자들

  • 검색어 유입 수

▶ 독립변수 : 인과 관계에서 "원인"이 되는 변수

  • 'pandas', 'numpy' 영문 표기
  • '판다스', '넘파이' 한글 표기

▶ 종속 변수 : 인과 관계에서 "결과"가 되는 변수

  • tistory 누적 조회수

▶ 통제 변수 : 실험 집단/통제 집단 모두에서 동등한 조건을 가져야 하는 변수

  • 독립변수 이외의 모든 텍스트
  • 글의 구성 및 첨부 이미지
  • 해시태그의 개수와 배치

▶ 샘플 크기 : 실험 참가자의 숫자

  • tistory 방문객 (미정)

▶ 실험 기간 : 가설 검증을 위한 데이터 수집 기간

  • 24. 06. 13 ~ 24. 09. 13

▶ 순차 테스트와 동시 테스트 여부

  • 동시 테스트 진행

 

4. 실험 과정

▶ tistory 게시글 발생 후 조회수 비교

 

 

Pandas와 Numpy 비교하기

1. Pandas✅ Index를 내가 원하는 대로 컨트롤할 수 있는 library1차원 Series 형으로 data type 변경 조건에 맞는 데이터 뽑기Series index 값 확인 Series value 값 확인 Series에 조건이 있는지 확인하기 결측치

seheehee.tistory.com

 

 

판다스와 넘파이 비교하기

1. 판다스✅ 인덱스를 내가 원하는 대로 컨트롤할 수 있는 라이브러리1차원 시리즈 형으로 데이터타입 변경 조건에 맞는 데이터 뽑기시리즈 인덱스 값 확인 시리즈 밸류 값 확인 시리즈에 조

seheehee.tistory.com

 

'데이터 분석' 카테고리의 다른 글

[EDA] Heatmap, 데이터 패턴과 관계 파악하기  (0) 2025.02.26
Pandas와 Numpy 비교하기  (0) 2024.06.13
판다스와 넘파이 비교하기  (0) 2024.06.13
DB Schema  (0) 2024.04.23
KPI (2) - 어떻게 하는건데?  (0) 2024.04.19