Printf

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

`printf`는 다양한 프로그래밍 언어에서 형식화된 출력을 생성하는 데 사용되는 함수이다. 초기 프로그래밍 언어인 포트란에서 시작하여 BCPL, ALGOL 68, C 언어에 이르기까지 발전해왔으며, 셸 명령어와 C++의 발전에도 영향을 미쳤다. `printf`는 형식 지정자를 사용하여 출력 형식을 제어하며, 플래그, 폭, 정밀도, 길이, 타입 등의 세부 설정을 지원한다. 그러나 형식 문자열 공격과 같은 보안 취약점을 가지고 있으며, C++20 이후 `std::format`과 C++23의 `std::print`와 같은 안전한 대안이 등장했다. `printf`는 C, C++, 자바, 파이썬, 셸 스크립트 등 다양한 언어에서 지원되며, 한국에서는 C/C++ 기반 시스템 프로그래밍 및 웹 개발에서 널리 사용된다.

더 읽어볼만한 페이지

Stdio.h - Scanf
`scanf`는 C 언어에서 표준 입력을 통해 데이터를 입력받는 함수로, `stdio.h`에 포함되어 있으며 다양한 형식 지정자를 통해 여러 형태의 데이터를 입력받을 수 있지만, 보안 취약점에 유의해야 하고, 관련 함수로 `fscanf`와 `sscanf`가 있다.
유닉스 소프트웨어 - GNU 코어 유틸리티
GNU 코어 유틸리티는 유닉스 계열 운영체제에서 파일, 셸, 텍스트 조작을 위한 기본적인 명령어 모음으로, GNU 파일 유틸리티에서 시작하여 3개의 패키지가 통합되어 발전했으며 셸 스크립트 및 시스템 관리에 필수적인 도구를 제공한다.
유닉스 소프트웨어 - 한/글
한/글은 1980년대 후반부터 개발된 대한민국의 대표적인 워드프로세서로, 다양한 운영체제 지원, 정부 전자 문서 시스템에서의 역할, 꾸준한 기능 발전과 사용자 편의성 및 국제 표준을 고려한 업데이트를 통해 발전해왔다.

2. 역사

`printf` 함수는 C 언어의 표준 입출력 라이브러리에 포함된 중요한 함수로, 지정된 형식에 맞춰 문자열을 출력하는 기능을 수행한다. 이 함수의 기원은 C 언어보다 앞선 초기 프로그래밍 언어들에서 찾아볼 수 있다.

1950년대의 포트란에서는 `FORMAT` 문을 사용하여 출력 형식을 지정하는 방식을 사용했다.^[1] 이후 1960년대에는 BCPL의 `writef` 함수^[3]와 ALGOL 68의 `printf` 함수가 등장하여 형식 지정 출력 기능을 제공했지만, 각각 고유한 문법적 특징을 가졌다.

1970년대에 이르러 C 언어가 개발되면서 `printf` 함수가 Version 4 Unix에 포함되었고^[7], 이후 C 언어의 표준 라이브러리 함수로 자리 잡았다. 1990년대에는 유닉스 셸 환경에서도 `printf` 명령어가 도입되어 널리 사용되기 시작했다.^[8]

그러나 C 언어의 `printf` 함수는 형식 문자열과 전달되는 인자의 타입이 일치하지 않을 경우 버퍼 오버플로와 같은 메모리 손상 취약점을 유발할 수 있는 타입 안전성 문제가 있었다.^[10] 이러한 문제를 해결하기 위해 C++에서는 컴파일 시점에 형식 문자열을 검사하는 기능(GCC의 `-Wformat` 옵션 등^[9])이 추가되었고, C++20 표준에서는 타입 안전성을 보장하는 `std::format` 라이브러리^[12]^[14]와 C++23 표준에서는 `std::print` 함수^[16]가 도입되어 더욱 안전하고 현대적인 형식 지정 출력 방식을 제공하게 되었다.

2. 1. 포트란 (1950년대)

초창기 프로그래밍 언어인 포트란은 형식 지정을 다른 계산과는 다른 문법을 가진 특수한 구문을 사용했다.^[1] 이 예시에서 형식은 601번째 줄에 지정되어 있으며, `PRINT` 명령은 이 줄 번호를 참조하여 연결된 라인 프린터에 인쇄한다. `FORMAT` 구문은 자기 테이프 데이터 저장소에 데이터를 기록하는 `WRITE OUTPUT TAPE` 명령에도 사용되었다.

PRINT 601, IA, IB, AREA

601 FORMAT (4H A= ,I5,5H B= ,I5,8H AREA= ,F10.2, 13H SQUARE UNITS)

여기서 각 형식 지정자의 의미는 다음과 같다.

`4H`: 4글자 문자열 `' A= '`를 나타낸다 (`H`는 홀러리스 상수를 의미한다).
`I5`: 너비가 5인 정수 필드를 나타낸다.
`F10.2`: 소수점 이하 2자리까지 표시하며, 전체 너비가 10인 부동 소수점 필드를 나타낸다.

만약 입력 인수로 각각 100, 200, 1500.25가 주어진다면, 출력 결과는 다음과 같을 수 있다.

A= 100 B= 200 AREA= 1500.25 SQUARE UNITS

2. 2. BCPL과 ALGOL 68 (1960년대)

1967년에 등장한 BCPL 언어는^[2] 라이브러리에 writef 루틴을 포함하여 형식 지정 출력을 지원했다.^[3] 예를 들어 다음과 같이 사용했다.

WRITEF("%I2-QUEENS PROBLEM HAS %I5 SOLUTIONS*N", NUMQUEENS, COUNT)

여기서 %I2는 너비가 2인 정수를, %I5는 너비가 5인 정수를 나타낸다. 이는 C 언어의 printf와 형식 지정자의 필드 너비와 유형 순서가 반대이다. *N은 줄 바꿈 문자를 나타내는 BCPL 언어의 이스케이프 시퀀스로, C 언어의 \n에 해당한다.

1968년에 나온 ALGOL 68은 더 함수와 유사한 API를 제공했지만, 여전히 특수 구문($ 기호로 형식 구문을 감싸는 방식)을 사용했다.

printf(($"Color "g", number1 "6d,", number2 "4zd,", hex "16r2d,", float "-d.2d,", unsigned value"-3d"."l$,

"red", 123456, 89, BIN 255, 3.14, 250));

이러한 방식은 Fortran과 달리 일반적인 함수 호출과 데이터 유형을 사용함으로써 언어와 컴파일러를 단순화하고, 입출력 기능을 언어 자체로 구현할 수 있게 하는 장점이 있었다.

2. 3. C 언어 (1970년대)

1973년, printf는 C 루틴으로 Version 4 Unix의 일부로 포함되었다.^[7]

2. 4. 셸 명령어 (1990년대)

1990년, printf 셸 명령어가 4.3BSD-Reno의 일부로 포함되었다. 이는 표준 라이브러리 함수를 모델로 했다.^[8] 1991년에는 printf 명령어가 GNU shellutils(현재 GNU Core Utilities)에 번들로 제공되었다.

2. 5. 안전성 문제와 C++의 발전 (2000년대 ~ 현재)

`printf` 함수의 타입 안전성 부족으로 인한 여러 문제점을 해결하기 위해 C++ 컴파일러가 `printf` 함수 호출을 인식하고 검사하려는 시도가 이루어졌다.

GCC의 `-Wformat` 옵션은 컴파일 시점에 `printf` 호출의 형식 문자열과 인자들의 타입을 검사하여 잘못된 사용을 감지할 수 있게 한다. 컴파일러 설정에 따라 경고를 표시하거나 오류로 처리하여 컴파일을 중단시킬 수도 있다.^[9] 이 옵션을 사용하면 컴파일러가 `printf` 형식 지정자를 이해하게 되므로, 사실상 형식 지정자를 C++ 구문의 일부로 확장하는 효과를 가진다.

하지만 `printf()`의 근본적인 형식 안정성 부족 문제^[10] 때문에 형식 지정 방식 자체를 개선하려는 노력이 이어졌고^[11], C++20 표준부터는 타입 안전성을 보장하는 새로운 형식 지정 기능이 언어 자체에 포함되었다.^[12]

C++20에 도입된 `std::format`은 Victor Zverovich가 개발한 `libfmt` 라이브러리^[13]의 API와 구문을 기반으로 하며, 사실상 `libfmt`를 표준 라이브러리로 통합한 것이다.^[14] Zverovich는 이 새로운 형식 지정 기능의 표준 제안서 초안 작성에도 참여했다.^[15] 결과적으로 `libfmt`는 C++20 형식 사양의 구현체 역할을 한다.

C++23 표준에서는 형식 지정 기능과 콘솔 출력을 결합하여, 기존 `printf()` 함수를 대체할 수 있는 `std::print` 함수를 새롭게 제공한다.^[16]

이제 형식 지정이 언어 구문의 일부가 되었기 때문에, C++ 컴파일러는 `-Wformat` 옵션과 같은 별도의 설정 없이도 기본적으로 형식 지정자와 인자 타입의 불일치를 감지하고 오류로 처리할 수 있다.

`libfmt` 및 `std::format`에서 사용하는 형식 지정 방식은 그 자체로 확장 가능한 "미니 언어"(특정 도메인 언어)로 설계되었다.^[17]

결론적으로, C++ 언어는 형식 지정을 위해 별도의 도메인 특정 미니 언어를 구문 내에 통합함으로써, 1950년대 FORTRAN의 초기 `PRINT` 구현 방식과 유사한 형태로 회귀하는 듯한 역사적 순환을 보여준다.

3. 서식 지정자

`printf` 함수는 서식 지정자(format specifier)를 사용하여 출력될 값의 형식을 지정한다. 서식 지정자는 형식 문자열(`format`) 내에서 사용되며, % 기호로 시작하여 뒤따르는 인수의 변환 방법을 정의한다.

예를 들어, 다음 코드는 문자열 "Your age is "를 출력한 뒤, 변수 age의 값을 10진수 정수(%d) 형식으로 출력한다.

```c

printf("Your age is %d", age);

```

서식화 문자열은 일반적인 멀티바이트 문자이거나 % 문자로 시작하는 변환 지정(conversion specification)으로 이루어진다. 멀티바이트 문자가 포함되어 있고, 문자 코드가 시프트 시퀀스에 의존하는 경우, 서식화 문자열은 초기 시프트 상태에서 시작하고 끝나야 한다. 서식 지정을 수행하는 %로 시작하는 각 부분을 서식 지정자(format specifier)라고 한다.

서식 지정자의 일반적인 구문은 다음과 같으며, 대괄호(`[ ]`) 안의 요소는 생략 가능하다.

%[인수 순서][플래그][최소 필드 폭][.정밀도][길이 수식어]변환 지정자

각 부분(플래그, 폭, 정밀도, 길이, 변환 지정자)은 출력 형식을 세부적으로 제어하는 역할을 하며, 이에 대한 자세한 내용은 하위 섹션에서 설명한다.

3. 1. 기본 구문

C 언어 표준 라이브러리 stdio.h 헤더 파일에 선언된 `printf` 함수의 원형은 일반적으로 다음과 같다.

#include

int printf(const char * restrict format, ...);

여기서 첫 번째 인수 `format`은 문자열 형태로, 뒤이어 오는 가변 인자(`...`)들이 어떤 형식으로 변환되어 출력될지를 지정하는 서식화 문자열이다. 서식화 문자열은 일반적인 멀티바이트 문자이거나 % 문자로 시작하는 변환 지정(conversion specification)으로 이루어진다. 멀티바이트 문자가 포함되어 있고, 문자 코드가 시프트 시퀀스에 의존하는 경우, 서식화 문자열은 초기 시프트 상태에서 시작하고 끝나야 한다. 서식 지정을 수행하는 %로 시작하는 각 부분을 서식 지정자(format specifier)라고 한다.

변환 지정, 즉 서식 지정자의 구문은 다음과 같은 형식을 가진다. 대괄호(`[ ]`) 안의 요소는 생략할 수 있다.

`%[인수 순서][플래그][최소 필드 폭][.정밀도][길이 수식어]변환 지정자`

예를 들어, 다음 C 코드는 `printf` 함수를 사용하여 여러 종류의 데이터를 지정된 형식으로 출력하는 방법을 보여준다.

printf("문자열 %s, 정수 %d, 16진수 %#x, 소숫점 %3.2f, 자른 문자열 %.*s \n", "test", 20, 0xf747, 3.1415f, 3, "toast");

위 코드를 실행하면 다음과 같은 결과가 출력된다.

문자열 test, 정수 20, 16진수 0xf747, 소숫점 3.14, 자른 문자열 toa

각 변환 지정(`%s`, `%d`, `%#x`, `%3.2f`, `%.*s`)이 어떻게 해당 인자("test", 20, 0xf747, 3.1415f, 3, "toast")를 형식화하여 출력하는지 보여준다.

3. 2. 플래그

(마이너스)출력을 왼쪽으로 정렬한다. (기본값은 오른쪽 정렬)+
(플러스)부호가 있는 숫자 형식으로 변환할 때, 양수일 경우 앞에 + 기호를 붙인다. (예: 양수는 +, 음수는 -)
(기본값은 양수 앞에 아무 기호도 붙이지 않음)
(공백)부호가 있는 숫자 형식으로 변환할 때, 양수일 경우 앞에 공백을 붙인다. (예: 양수는 , 음수는 -)
이 플래그는 + 플래그가 사용되면 무시된다.
(기본값은 양수 앞에 아무것도 붙이지 않음)0
(영)폭(width) 옵션이 지정되었을 때, 숫자 앞에 공백 대신 0을 채워 넣는다.
예를 들어, printf("%4X", 3)은 " 3"을 출력하지만, printf("%04X", 3)은 "0003"을 출력한다. 정수 및 부동소수점 형식에 적용된다. 일부 구현에서는 왼쪽 정렬(-) 플래그가 있으면 이 플래그를 무시한다.\'
(아포스트로피)10진수 변환(정수 i, d, u 또는 부동소수점 f, g)의 정수 부분에 천 단위 구분 기호(예: 쉼표 ,)를 적용한다. 로캘 설정에 따라 구분 기호가 달라질 수 있다.#
(해시)대체 형식을 사용한다.
* g 및 G 형식: 후행 0을 제거하지 않는다.
* f, F, e, E, g, G 형식: 소수점 이하 자릿수가 없더라도 항상 소수점을 출력한다.
* o, x, X 형식: 0이 아닌 숫자 앞에 각각 0, 0x, 0X 접두사를 붙인다.

Printf
기본 정보
이 문서는 컴퓨터 프로그래밍에 관한 것입니다. 다른 의미에 대해서는 프린트 문서를 참조하십시오.
C
유형	함수
정의	stdio.h
첫 번째 나타남	유닉스 버전 5
POSIX
표준	ISO/IEC 9899:1990 / ANSI X3.159-1989: 표준 C ISO/IEC 9899:1999: C99 ISO/IEC 9899:2011: C11
구문
언어	C
원형	int printf(const char *format, ...);
반환 값	성공 시, 기록된 문자 수, 오류 시 음수 값
스레드 안전성	안전함

수식자	의미	도입 버전
hh	인수는 `char`형 (`signed char` 또는 `unsigned char`로 해석 후 `int`로 승격됨)	C99 이후
h	인수는 `short`형 (`signed short` 또는 `unsigned short`로 해석 후 `int` 또는 `unsigned int`로 승격됨)	모든 버전
\|정수형의 경우 인수는 `long`형 또는 `unsigned long`형. 부동소수점형의 경우 인수는 `double`형 (가변 인자에서는 `float`가 `double`로 승격되므로 사실상 불필요^[19]). 문자/문자열의 경우 인수는 `wint_t`형 또는 `wchar_t*`형.	`wint_t` 및 `wchar_t`에 대해서는 C95 이후, `double`에 대해서는 C99 이후 (호환성 목적)
\|인수는 `long long`형 또는 `unsigned long long`형	C99 이후
j	인수는 `intmax_t`형 또는 `uintmax_t`형	C99 이후
z	인수는 `size_t`형 또는 대응하는 부호 있는 정수형	C99 이후
t	인수는 `ptrdiff_t`형 또는 대응하는 부호 없는 정수형	C99 이후
L	인수는 `long double`형	모든 버전

문자	설명	일반적으로 발견되는 플랫폼
I	부호 있는 정수형의 경우, `printf`는 `ptrdiff_t` 크기의 정수 인수를 예상한다. 부호 없는 정수형의 경우, `printf`는 `size_t` 크기의 정수 인수를 예상한다.	Win32/Win64
I32	정수형의 경우, `printf`는 32비트 정수 인수를 예상한다.	Win32/Win64
I64	정수형의 경우, `printf`는 64비트 정수 인수를 예상한다.	Win32/Win64
q	정수형의 경우, `printf`는 64비트 정수 인수를 예상한다.	BSD

매크로	설명 (일반적인 값)
PRId32	`I32d` (Win32/Win64) 또는 `d`
PRId64	`I64d` (Win32/Win64), `lld` (32비트 플랫폼) 또는 `ld` (64비트 플랫폼)
PRIi32	`I32i` (Win32/Win64) 또는 `i`
PRIi64	`I64i` (Win32/Win64), `lli` (32비트 플랫폼) 또는 `li` (64비트 플랫폼)
PRIu32	`I32u` (Win32/Win64) 또는 `u`
PRIu64	`I64u` (Win32/Win64), `llu` (32비트 플랫폼) 또는 `lu` (64비트 플랫폼)
PRIx32	`I32x` (Win32/Win64) 또는 `x`
PRIx64	`I64x` (Win32/Win64), `llx` (32비트 플랫폼) 또는 `lx` (64비트 플랫폼)

문자	설명
%	문자 % 자체를 출력한다 (이 유형은 플래그, 너비, 정밀도, 길이 필드를 허용하지 않는다).
d, i	부호 있는 정수로서의 int. %d와 %i는 출력 시 동일하지만, 입력 시 scanf와 함께 사용될 때는 다르다 (%i를 사용하면 숫자가 0x로 시작하면 16진수로, 0으로 시작하면 8진수로 해석된다).
u	10진수 unsigned int를 출력한다.
f, F	일반적인 (고정 소수점) 표기법으로 double. f와 F는 무한대 또는 NaN에 대한 문자열 출력 방식만 다르다 (f의 경우 inf, infinity, nan; F의 경우 INF, INFINITY, NAN).
e, E	표준 형식으로 double 값 (d.ddde±dd). E 변환은 지수를 나타내기 위해 문자 E를 사용한다 (e 대신). 지수는 항상 두 자리 이상을 포함하며, 값이 0이면 지수는 00이다. Windows에서는 지수가 기본적으로 세 자리 (예: 1.5e002)를 포함하지만, Microsoft 고유의 _set_output_format 함수로 변경할 수 있다.
g, G	일반 또는 지수 표기법으로 double을 출력하며, 크기에 따라 더 적절한 형식을 사용한다. g는 소문자를 사용하고, G는 대문자를 사용한다. 이 유형은 고정 소수점 표기법과 약간의 차이가 있는데, 소수점 오른쪽에 있는 의미 없는 0은 포함되지 않으며, 정수에는 소수점이 포함되지 않는다.
x, X	16진수로 unsigned int를 출력한다. x는 소문자를 사용하고, X는 대문자를 사용한다.
o	8진수로 unsigned int를 출력한다.
s	널 종료 문자열.
c	char (문자).
p	구현 정의 형식으로 void* (void에 대한 포인터).
a, A	0x 또는 0X로 시작하는 16진수 표기법으로 double. a는 소문자를 사용하고, A는 대문자를 사용한다.^[20]^[21] (C++11 iostreams에는 동일하게 작동하는 hexfloat가 있다).
n	아무것도 출력하지 않지만, 지금까지 출력된 문자 수를 정수 포인터 매개변수에 쓴다. Java에서는 줄 바꿈을 출력한다.^[22]

Printf

1. 개요

더 읽어볼만한 페이지

2. 역사

2. 1. 포트란 (1950년대)

2. 2. BCPL과 ALGOL 68 (1960년대)

2. 3. C 언어 (1970년대)

2. 4. 셸 명령어 (1990년대)

2. 5. 안전성 문제와 C++의 발전 (2000년대 ~ 현재)

3. 서식 지정자

3. 1. 기본 구문

3. 2. 플래그

3. 3. 폭

3. 4. 정밀도

3. 5. 길이

3. 6. 타입

3. 7. POSIX 확장 (인수 순서 지정)

4. 변형 함수

5. 취약점

6. printf를 지원하는 프로그래밍 언어

7. 한국어 위키백과 특화 정보

7. 1. 한국 프로그래밍 환경

참조