문제 설명
카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를
생성하는 업무를 담당하게 되었습니다.
"네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때,
입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.
- 아이디의 길이는 3자 이상 15자 이하여야 합니다.
- 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
- 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.
"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가
카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.
1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"
2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"
3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"
4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"
7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"
따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때,
네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.
[문제]
신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때,
"네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.
[제한사항]
new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.
[입출력 예]
new_id | result | |
예1 | "...!@BaT#*..y.abcdefghijklm" | "bat.y.abcdefghi" |
예2 | "z-+.^." | "z--" |
예3 | "=.=" | "aaa" |
예4 | "123_.def" | "123_.def" |
예5 | "abcdefghijklmn.p" | "abcdefghijklmn" |
입출력 예에 대한 설명
입출력 예 #1
문제의 예시와 같습니다.
입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "z-+.^." → "z-.."
3단계 "z-.." → "z-."
4단계 "z-." → "z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-" → "z--"
입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "=.=" → "."
3단계 변화 없습니다.
4단계 "." → "" (new_id가 빈 문자열이 되었습니다.)
5단계 "" → "a"
6단계 변화 없습니다.
7단계 "a" → "aaa"
입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id("123_.def")는 변하지 않습니다.
즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.
입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p" → "abcdefghijklmn." → "abcdefghijklmn"
7단계 변화 없습니다.
<cpp>
#include <string>
#include <vector>
#include <iostream>
using namespace std;
string solution(string new_id) {
string answer = "";
// 1
for(int i=0; i<new_id.length(); i++) {
if(new_id[i] >= 'A' && new_id[i] <= 'Z') {
new_id[i] = tolower(new_id[i]);
}
}
// 2
for(int i=0; i<new_id.length(); i++) {
char c = new_id[i];
if(!(c >= 'a' && c <= 'z') && !(c >= '0' && c <= '9') &&
c != '-' && c != '_' && c != '.') {
new_id.erase(new_id.begin() + i);
i--;
}
}
// 3
for(int i=1; i<new_id.length(); i++) {
if(new_id[i] == '.' && new_id[i-1] == '.') {
new_id.erase(new_id.begin() + i);
i--;
}
}
// 4
if(new_id.front() == '.') {
new_id.erase(new_id.begin());
}
if(new_id.back() == '.') {
new_id.erase(new_id.end()-1);
}
// 5
if(new_id.length() == 0) {
new_id = "a";
}
// 6
if(new_id.length() >= 16) {
while(new_id.length() != 15) {
new_id.erase(new_id.end()-1);
}
if(new_id.back() == '.') {
new_id.erase(new_id.end()-1);
}
}
// 7
if(new_id.length() <= 2) {
while(true) {
new_id += new_id.back();
if(new_id.length() == 3) break;
}
}
answer = new_id;
return answer;
}
2단계와 3단계, 그리고 string 클래스의 end()에서 헤맸다.
일단 end()는 string의 맨 마지막 이터레이터가 아니라 맨 마지막 다음의 이터레이터를 반환하는 함수였다.
그래서 자꾸 seg fault 오류가 났다.
그리고 2단계에서 한동안 막혀있었는데, 결국 length의 문제였다.
문자열의 길이만큼 반복문을 돌면서 조건에 부합할 시 문자열에서 삭제하는 로직이다.
하지만 반복문의 조건에 들어가있는 i<new_id.length()의 new_id.length()는 처음에 문자열이 매개변수로 들어왔을때의
길이이다.
따라서 반복문에서 조건에 맞을때 문자가 삭제되면 길이가 하나 줄어야 하는데 줄지않고 반복문을 돌기 때문에 오류가
발생했던 것이다.
만약 string str = "abcd"라는 문자열이 있다고 하자.
b의 인덱스는 1이다. (str[1] == 'b';)
여기서 b를 삭제하면 "acd"라는 문자열이 되고, 반복문 한번을 끝냈기때문에 i++가 된다.
그러면 1다음 str[2]로 if문을 비교해야 하는데 여기서 str[2]는 우리가 생각한 c가 아니라 d가된다.
따라서 삭제해줬을 경우엔 i--를 해줘야한다.
3단계도 마찬가지의 이유로 i--를 해줘야한다.
<js> (다른사람 풀이 참조)
const solution = (new_id) => {
const id = new_id
.toLowerCase()
.replace(/[^\w\d-_.]/g, '')
.replace(/\.{2,}/g, '.')
.replace(/^\.|\.$/g, '')
.padEnd(1, 'a')
.slice(0, 15)
.replace(/^\.|\.$/g, '')
return id.padEnd(3, id[id.length-1])
}
cpp로는 엄청 긴 코드가 js로는 정규표현식과 chaining을 통해 완전 간결하게 해결되었다.
replace(a,b)는 a조건에 해당하는 것을 b로 바꿔준다.
천천히 살펴보자.
- toLowerCase() : 모두 소문자로 바꿔준다.
- 코드에서 모든 정규표현식 뒤에 g가 붙는데, 이것은 정규표현식과 일치하는 패턴 맨 첫번째가 아니라,
문자열 전체를 탐색하면서 일치하는 모든 패턴을 찾게된다. - [^\w\d-_.]
- \w : 영숫자 문자에 해당한다. [A-Za-z0-9_]와 동일하다.
- \d : 숫자문자에 해당한다.
- -_. : 문자 그대로 '-', '_', '.'를 나타낸다.
- ^ : 부정기호이다.
- 따라서 영어, 숫자, '-', '_', '.' 가 아닌것을 모두 ''으로, 즉 없애버린다.
- \.{2,}
- \. : 만약 그냥 '.'만 쓴다면 개행문자를 제외한 모든 단일문자와 대응된다.
하지만 앞에 \가 붙을경우, 뒤에 오는것이 특별한 기능을 가진 특별문자로 취급되지 않고 문자열로 취급된다.
따라서 그냥 "."을 말한다. - {2,} : 만약 {n,m} 이라면 n이상 m이하를 말하지만, m이 생략되면 무한대를 말한다.
따라서 2이상인 모든수를 의미한다. - 결국 '.'이 2개 이상오는 패턴을 모두 '.' 한개로 바꾸는것이다.
- \. : 만약 그냥 '.'만 쓴다면 개행문자를 제외한 모든 단일문자와 대응된다.
- ^\.|\.$
- ^\. : 만약 [^\.] 이라면 '.'이 아닌 것을 의미한다.
하지만 []없이 하게 된다면, ^는 문자열의 처음을 나타낸다.
따라서 '.'이 문자열의 처음에 오는 패턴을 말한다. - \.$ : $는 문자열의 끝을 의미한다.
따라서 '.'이 문자열의 끝에 오는 패턴을 말한다. - 결국 '.'이 문자열의 처음이나 끝에 오는 경우에 ''으로, 즉 없애버린다.
- ^\. : 만약 [^\.] 이라면 '.'이 아닌 것을 의미한다.
- padEnd(1, 'a')
- 만약 문자열의 길이가 1보다 작다면, 즉 문자열이 ""일경우에 'a'로 채워넣는다.
- padEnd(목표 문자열 길이, 채워 넣을 문자열) 이다.
- slice(0,15)
- 문자열의 0번째 인덱스부터 15번째 인덱스 "전"까지 잘라서 새로운 문자열을 반환해준다.
- 따라서 결국 0~14까지 인덱스의 길이, 즉 앞에서 부터 15개만큼 자른 문자열을 반환해주는것이다.
- ^\.|\.$
- 위와 동일
- padEnd(3, id[id.length-1])
- 마지막 조건이 길이가 2자 이하라면 길이가 3이될때까지 마지막 문자를 계속 채워넣는것이다.
- 따라서 padEnd의 첫번째 매개변수인 목표 길이인 3을 넣어주고,
- id.length는 id의 길이를 나타내는데, 길이-1을 해주면 문자열의 맨마지막 인덱스이기 때문에,
- 3만큼 맨 마지막 문자로 채워주는것이다.
'PS > Programmers' 카테고리의 다른 글
Programmers / Level1 / 없는 숫자 더하기 / C++ (0) | 2021.10.14 |
---|---|
Programmers / Level1 / 크레인 인형뽑기 / C++ / JS (0) | 2021.10.14 |
Programmers / Level1 / 로또의 최고 순위와 최저 순위 / C++ (0) | 2021.10.07 |
Programmers / Level1 / 숫자 문자열과 영단어 / C++ / JS (0) | 2021.10.05 |