PS/Programmers

Programmers / Level1 / 신규 아이디 추천 / C++ / JS

KimMinJun 2021. 10. 9. 02:43

문제 설명

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를

생성하는 업무를 담당하게 되었습니다.

"네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때,

입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가

카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.

2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.

3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.

4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.

5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.

6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.

만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.

7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.


예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

 

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm"  "...!@bat#*..y.abcdefghijklm"

2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm"  "...bat..y.abcdefghijklm"

3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm"  ".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm"  "bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm"  "bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm"  "bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi"  "bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때,

네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.


[문제]

신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때,

"네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.


[입출력 예]

  new_id result
예1 "...!@BaT#*..y.abcdefghijklm" "bat.y.abcdefghi"
예2 "z-+.^." "z--"
예3 "=.=" "aaa"
예4 "123_.def" "123_.def"
예5 "abcdefghijklmn.p" "abcdefghijklmn"

입출력 예에 대한 설명


입출력 예 #1
문제의 예시와 같습니다.

 

입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.

1단계 변화 없습니다.
2단계 "z-+.^."  "z-.."
3단계 "z-.."  "z-."
4단계 "z-."  "z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-"  "z--"

 

입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.

1단계 변화 없습니다.
2단계 "=.="  "."
3단계 변화 없습니다.
4단계 "."  "" (new_id가 빈 문자열이 되었습니다.)
5단계 ""  "a"
6단계 변화 없습니다.
7단계 "a"  "aaa"

 

입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id("123_.def")는 변하지 않습니다.

즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.

 

입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p"  "abcdefghijklmn."  "abcdefghijklmn"
7단계 변화 없습니다.

 

<cpp>

#include <string>
#include <vector>
#include <iostream>

using namespace std;

string solution(string new_id) {
    string answer = "";
    
    // 1
    for(int i=0; i<new_id.length(); i++) {
        if(new_id[i] >= 'A' && new_id[i] <= 'Z') {
            new_id[i] = tolower(new_id[i]);
        }        
    }
    
    // 2
    for(int i=0; i<new_id.length(); i++) {
        char c = new_id[i];
        
        if(!(c >= 'a' && c <= 'z') && !(c >= '0' && c <= '9') &&
          c != '-' && c != '_' && c != '.') {
            new_id.erase(new_id.begin() + i);
            i--;
        }
    }
        
    // 3
    for(int i=1; i<new_id.length(); i++) {
        if(new_id[i] == '.' && new_id[i-1] == '.') {
            new_id.erase(new_id.begin() + i);
            i--;
        }
    }
        
    // 4
    if(new_id.front() == '.') {
        new_id.erase(new_id.begin());
    }
    if(new_id.back() == '.') {
        new_id.erase(new_id.end()-1);
    }
    
    // 5
    if(new_id.length() == 0) {
        new_id = "a";
    }
    
    // 6
    if(new_id.length() >= 16) {
        while(new_id.length() != 15) {
            new_id.erase(new_id.end()-1);
        }
        if(new_id.back() == '.') {
            new_id.erase(new_id.end()-1);
        }
    }
        
    // 7
    if(new_id.length() <= 2) {
        while(true) {
            new_id += new_id.back();
            
            if(new_id.length() == 3) break;
        }
    }
    
    answer = new_id;
    
    return answer;
}

 

2단계와 3단계, 그리고 string 클래스의 end()에서 헤맸다.

일단 end()는 string의 맨 마지막 이터레이터가 아니라 맨 마지막 다음의 이터레이터를 반환하는 함수였다.

그래서 자꾸 seg fault 오류가 났다.

 

그리고 2단계에서 한동안 막혀있었는데, 결국 length의 문제였다.

문자열의 길이만큼 반복문을 돌면서 조건에 부합할 시 문자열에서 삭제하는 로직이다.

하지만 반복문의 조건에 들어가있는 i<new_id.length()의 new_id.length()는 처음에 문자열이 매개변수로 들어왔을때의

길이이다.

따라서 반복문에서 조건에 맞을때 문자가 삭제되면 길이가 하나 줄어야 하는데 줄지않고 반복문을 돌기 때문에 오류가

발생했던 것이다.

 

만약 string str = "abcd"라는 문자열이 있다고 하자.

b의 인덱스는 1이다. (str[1] == 'b';)

여기서 b를 삭제하면 "acd"라는 문자열이 되고, 반복문 한번을 끝냈기때문에 i++가 된다.

그러면 1다음 str[2]로 if문을 비교해야 하는데 여기서 str[2]는 우리가 생각한 c가 아니라 d가된다.

따라서 삭제해줬을 경우엔 i--를 해줘야한다.

 

3단계도 마찬가지의 이유로 i--를 해줘야한다.


<js> (다른사람 풀이 참조)

const solution = (new_id) => {
    const id = new_id
        .toLowerCase()
        .replace(/[^\w\d-_.]/g, '')
        .replace(/\.{2,}/g, '.')
        .replace(/^\.|\.$/g, '')
        .padEnd(1, 'a')
        .slice(0, 15)
        .replace(/^\.|\.$/g, '')        
    return id.padEnd(3, id[id.length-1])
}

cpp로는 엄청 긴 코드가 js로는 정규표현식과 chaining을 통해 완전 간결하게 해결되었다.

replace(a,b)는 a조건에 해당하는 것을 b로 바꿔준다.

 

천천히 살펴보자.

  • toLowerCase() : 모두 소문자로 바꿔준다.
  • 코드에서 모든 정규표현식 뒤에 g가 붙는데, 이것은 정규표현식과 일치하는 패턴 맨 첫번째가 아니라,
    문자열 전체를 탐색하면서 일치하는 모든 패턴을 찾게된다.
  • [^\w\d-_.]
    • \w : 영숫자 문자에 해당한다. [A-Za-z0-9_]와 동일하다.
    • \d : 숫자문자에 해당한다.
    • -_. : 문자 그대로 '-', '_', '.'를 나타낸다.
    • ^ : 부정기호이다.
    • 따라서 영어, 숫자, '-', '_', '.' 가 아닌것을 모두 ''으로, 즉 없애버린다.
  • \.{2,}
    • \. : 만약 그냥 '.'만 쓴다면 개행문자를 제외한 모든 단일문자와 대응된다.
      하지만 앞에 \가 붙을경우, 뒤에 오는것이 특별한 기능을 가진 특별문자로 취급되지 않고 문자열로 취급된다.
      따라서 그냥 "."을 말한다.
    • {2,} : 만약 {n,m} 이라면 n이상 m이하를 말하지만, m이 생략되면 무한대를 말한다.
      따라서 2이상인 모든수를 의미한다.
    • 결국 '.'이 2개 이상오는 패턴을 모두 '.' 한개로 바꾸는것이다.
  • ^\.|\.$
    • ^\. : 만약 [^\.] 이라면 '.'이 아닌 것을 의미한다.
      하지만 []없이 하게 된다면, ^는 문자열의 처음을 나타낸다.
      따라서 '.'이 문자열의 처음에 오는 패턴을 말한다.
    • \.$ : $는 문자열의 끝을 의미한다.
      따라서 '.'이 문자열의 끝에 오는 패턴을 말한다.
    • 결국 '.'이 문자열의 처음이나 끝에 오는 경우에 ''으로, 즉 없애버린다.
  • padEnd(1, 'a')
    • 만약 문자열의 길이가 1보다 작다면, 즉 문자열이 ""일경우에 'a'로 채워넣는다.
    • padEnd(목표 문자열 길이, 채워 넣을 문자열) 이다.
  • slice(0,15)
    • 문자열의 0번째 인덱스부터 15번째 인덱스 "전"까지 잘라서 새로운 문자열을 반환해준다.
    • 따라서 결국 0~14까지 인덱스의 길이, 즉 앞에서 부터 15개만큼 자른 문자열을 반환해주는것이다.
  • ^\.|\.$
    • 위와 동일
  • padEnd(3, id[id.length-1])
    • 마지막 조건이 길이가 2자 이하라면 길이가 3이될때까지 마지막 문자를 계속 채워넣는것이다.
    • 따라서 padEnd의 첫번째 매개변수인 목표 길이인 3을 넣어주고,
    • id.length는 id의 길이를 나타내는데, 길이-1을 해주면 문자열의 맨마지막 인덱스이기 때문에,
    • 3만큼 맨 마지막 문자로 채워주는것이다.