- 세상의 모든 계산기 자유(질문) 게시판 일반 ()
(Nginx) "웹 크롤러 request 순위 확인" 스크립트 (우분투)
#!/bin/bash # monip.sh # Nginx access 로그에서 상위 25개 IP를 분석하여 # - Bot (Crawler)인 경우: User-Agent 문자열로 Bot 종류를 추출 # - User인 경우: whois 명령으로 Organization Name 조회 # 그리고 IP별 국가 정보(geoiplookup)를 추가하여 출력함 LOG_FILE="/var/log/nginx/access.log" if [ ! -f "$LOG_FILE" ]; then echo "로그 파일이 존재하지 않습니다: $LOG_FILE" exit 1 fi awk ' # Bot의 종류를 판별하는 함수 function get_bot_type(ua, ua_lower) { ua_lower = tolower(ua) if(ua_lower ~ /googlebot/) return "Googlebot" if(ua_lower ~ /bingbot/) return "Bingbot" if(ua_lower ~ /slurp/) return "Yahoo Slurp" if(ua_lower ~ /duckduckbot/) return "DuckDuckBot" if(ua_lower ~ /baiduspider/) return "Baiduspider" if(ua_lower ~ /yandex/) return "YandexBot" return "Unknown Bot" } # User-Agent 문자열을 바탕으로 사용자 종류를 판별 function classify_user_agent(ua) { if(ua == "" || ua == "-") return "알 수 없음" ua_lower = tolower(ua) if(ua_lower ~ /bot|crawl|spider|slurp|mediapartners/) return "Bot (Crawler)" return "User" } # geoiplookup 명령을 사용하여 IP의 국가 정보를 가져오는 함수 function get_country(ip, cmd, result, arr, country) { cmd = "geoiplookup " ip " 2>/dev/null" if ((cmd | getline result) > 0) { # 예: "GeoIP Country Edition: US, United States" split(result, arr, ":") if(length(arr) > 1) { country = arr[2] gsub(/^[ \t]+|[ \t]+$/, "", country) } else { country = "Unknown" } } else { country = "조회 실패" } close(cmd) return country } { # Combined log format 예제: # 127.0.0.1 - - [14/Feb/2025:12:00:00 +0000] "GET / HTTP/1.1" 200 612 "-" "Mozilla/5.0 ..." regex = "([^ ]*) - ([^ ]*) \\[([^\\]]*)\\] \"([^\"]*)\" ([^ ]*) ([^ ]*) \"([^\"]*)\" \"([^\"]*)\"" if(match($0, regex, arr)) { ip = arr[1] referer = arr[7] ua_str = arr[8] count[ip]++ # IP별 요청 횟수 집계 ua_stats[ip, ua_str]++ # IP별 User-Agent 빈도 집계 ref_stats[ip, referer]++ # (참고용) 리퍼러 집계 } } END { # gawk의 asorti() 함수로 요청 횟수 기준 내림차순 정렬 n = asorti(count, sorted, "@val_num_desc") # 헤더 출력 (순서: 순위 | IP | 국가 | Requests | 사용자 종류 | 기타정보) printf("| %-2s | %-15s | %-18s | %-10s | %-17s | %-21s |\n", "순위", "IP", "국가", "Requests", "사용자 종류", "기타정보") print("|------|-----------------|----------------------|------------|------------------------|-------------------------|") limit = (n < 25 ? n : 25) for(i = 1; i <= limit; i++){ ip = sorted[i] req_count = count[ip] # 해당 IP의 가장 많이 등장한 User-Agent 선택 max_ua = "" max_ua_count = 0 for(key in ua_stats) { split(key, parts, SUBSEP) if(parts[1] == ip) { if(ua_stats[key] > max_ua_count) { max_ua_count = ua_stats[key] max_ua = parts[2] } } } user_type = classify_user_agent(max_ua) extra = "" if(user_type == "User") { # User인 경우: whois 명령으로 Organization Name 조회 cmd = "whois " ip " 2>/dev/null | grep -i -m 1 \"orgname:\"" org = "" if((cmd | getline org) > 0) { sub(/^[ \t]+/, "", org) split(org, a, ":") if(length(a) > 1) { org = a[2] gsub(/^[ \t]+/, "", org) } } else { org = "조회 실패" } close(cmd) extra = org } else if(user_type == "Bot (Crawler)") { extra = get_bot_type(max_ua) } else { extra = "없음" } # 각 IP의 국가 정보 추가 country = get_country(ip) printf("| %-4d | %-15s | %-20s | %-10d | %-22s | %-25s |\n", i, ip, country, req_count, user_type, extra) } } ' "$LOG_FILE"
사용 방법
- 스크립트를 파일에 저장 후 실행 권한 부여:
chmod +x monip.sh
- 스크립트 실행 (필요한 경우 sudo로):
sudo ./monip.sh
결과
세상의모든계산기 님의 최근 댓글
fx-CG 의 경우 분모→A, 분자→B 로 저장해 풀어보면 fx-570 과 같이 A,B,C,D 로 나눠서 계산하면 결과는 둘 다 같음. 73.0495070585238 (15 digits) 같은 15digits 정밀도라도, 공학용 계산기에 따라 결과가 달라질 수 있는 건가? 입력 실수했나? - 어쨌건, TI-nspire 보다 정밀한 결과값 - 파이썬 시뮬레이터상 15 digits 값과 같진 않지만, 유사함. 2025 10.22 [공학용 계산기] 계산기 내부에서 사용하는 유효숫자 자릿수 Significant Digits https://allcalc.org/8848 2025 10.22 계산 정확도 (Internal Precision) 저게 맞나 싶은데요? 무슨 의미로 사용된 용어인지 검증이 필요한 듯 합니다. fx-570 ES PLUS 만 해도 내부 유효자릿수가 15-digits 입니다. https://allcalc.org/55918#comment_55944 2025 10.22 TI-nspire 로 동일하게 A, B, C, D 나누어 계산해 봐도... 한꺼번에 계산한 것과 똑같은 결과 "어? TI-nspire가 유효자릿수가 하나 적나?" 하고 1.234567890123456789 입력하고 Ans - 1.2345678 해 보니 내부 유효자릿수가 다르게 나오네요. TI-nspire 는 (십진수) 14-digits CASIO fx-570 ES 는 (십진수) 15-digits 둘 다 같다고 착각하고 있었나봅니다. 2025 10.22 카시오 fx-570 ES 로 계산하면? 카시오도 (십진수) 14digits 한계이므로, 비슷한 값이 나올 것으로 예상됨. 다만, stack 한계로 한번에 계산이 불가능하므로 부분을 나누어 계산 → A → B → C → D 최종 계산 결과에서 73.049507 을 빼면 fx-570 ES가 구한 결과값(Ans)은 73.0495070584404 (15digits) 로 최종 확인됨. - TI-Nspire 보다 오차가 작음. - 파이썬 시뮬레이션 15 digits 와는 차이가 있음. 2025 10.22