본문 바로가기
공부/파이썬 Python

파이썬으로 가짜 데이터 셋 만들기 (Faker)

by 혼밥맨 2022. 4. 21.
반응형

 

파이썬으로 가짜 데이터 셋 만들기 (Faker)

_|_|_|_|          _|
_|        _|_|_|  _|  _|      _|_|    _|  _|_|
_|_|_|  _|    _|  _|_|      _|_|_|_|  _|_|
_|      _|    _|  _|  _|    _|        _|
_|        _|_|_|  _|    _|    _|_|_|  _|

라이브러리

1) Faker


1
pip install faker
cs

 

Faker 라이브러리는 가짜 데이터를 생성하는 파이썬 패키지입니다. 데이터베이스를 부트스트랩하거나, 보기 좋은 XML 문서를 작성하거나, 지속성을 채워 테스트하거나, 프로덕션 서비스에서 가져온 데이터를 익명화해야 하는 경우 등, Faker는 여러분을 위한 것입니다.

 

가짜 개인정보 생성하기

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
from faker import Faker
 
# 기본으로 미국 기반 가짜 데이터를 제공합니다.
= Faker()
 
print(f.name())                 # Rebecca Santos
print(f.address())                # 965 Martinez Bridge Suite 665
print(f.ipv4_private())            # 192.108.103.84
print(f.ipv4_public())            # 185.92.219.11
print(f.sentence())                # Admit environmental result second skin one.
print(f.zipcode())                # 39045
print(f.locale())                # ug_CN
print(f.license_plate())        # C39 7WQ
print(f.phone_number())            # 271.917.1476x8312
 
 
# 특정 국가언어를 패스함으로써 특정 국가 기반 데이터를 생성할 수 있음.
# f = Faker(["fr_FR"])             # 프랑스
= Faker(["de_DE"])             # 독일
 
print(f.name())                 # Giovanni Baum
print(f.address())                # Veronika-Pechel-StraBe 205
print(f.ipv4_private())            # 172.26.94.15
print(f.ipv4_public())            # 62.139.244.215
print(f.sentence())                # Merken Affe SchÜler.
print(f.locale())                # ff_SN
print(f.license_plate())        # NU-D-55
print(f.phone_number())            # +49 (0) 4383 089862
cs

 

가짜 MAC 주소 생성하기

1
2
3
4
5
6
7
8
9
from faker import Faker
 
 
= Faker(["fr_FR"])
 
for _ in range(5):
    print(f.hexify(text="MAC: ^^:^^:^^:^^:^^:^^", upper=True))
 
 
cs

 

랜덤 프로바이더 (Provider) 클래스 생성하기

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
from random
from faker import Faker
from faker.providers import BaseProvider
 
 
= Faker()
 
 
# Provider
class NeuralProvider(BaseProvider):
    def video_category(self):
        return random.choice(["Machine Learning""Vim""Linux""Finance"])
    def video_title(self):
        return "TITLE"
 
 
f.add_provider(NeuralProvider)
 
print(f.video_category())
print(f.video_title())
cs

 

랜덤 다이나믹 프로바이더 (Dynamic Provider) 클래스 생성하기

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from random
from faker import Faker
from faker.providers import BaseProvider
 
 
= Faker()
 
# Dynamic Provider
programming_language_provider = DynamicProvider(
    provider_name = "programming_language",
    elements = ["Python""Go""JS""Ruby""C#"]
)
 
 
f.add_provider(programming_language_provider)
print(f.programming_language())
cs

 

 

Faker 라이브러리 다큐멘테이션 링크

https://faker.readthedocs.io/en/master/

 

 

반응형

댓글