- 세상의 모든 계산기 자유(질문) 게시판 일반 ()
(Nginx) "웹 크롤러 request 순위 확인" 스크립트 (우분투)
#!/bin/bash
# monip.sh
# Nginx access 로그에서 상위 25개 IP를 분석하여
# - Bot (Crawler)인 경우: User-Agent 문자열로 Bot 종류를 추출
# - User인 경우: whois 명령으로 Organization Name 조회
# 그리고 IP별 국가 정보(geoiplookup)를 추가하여 출력함
LOG_FILE="/var/log/nginx/access.log"
if [ ! -f "$LOG_FILE" ]; then
echo "로그 파일이 존재하지 않습니다: $LOG_FILE"
exit 1
fi
awk '
# Bot의 종류를 판별하는 함수
function get_bot_type(ua, ua_lower) {
ua_lower = tolower(ua)
if(ua_lower ~ /googlebot/) return "Googlebot"
if(ua_lower ~ /bingbot/) return "Bingbot"
if(ua_lower ~ /slurp/) return "Yahoo Slurp"
if(ua_lower ~ /duckduckbot/) return "DuckDuckBot"
if(ua_lower ~ /baiduspider/) return "Baiduspider"
if(ua_lower ~ /yandex/) return "YandexBot"
return "Unknown Bot"
}
# User-Agent 문자열을 바탕으로 사용자 종류를 판별
function classify_user_agent(ua) {
if(ua == "" || ua == "-") return "알 수 없음"
ua_lower = tolower(ua)
if(ua_lower ~ /bot|crawl|spider|slurp|mediapartners/) return "Bot (Crawler)"
return "User"
}
# geoiplookup 명령을 사용하여 IP의 국가 정보를 가져오는 함수
function get_country(ip, cmd, result, arr, country) {
cmd = "geoiplookup " ip " 2>/dev/null"
if ((cmd | getline result) > 0) {
# 예: "GeoIP Country Edition: US, United States"
split(result, arr, ":")
if(length(arr) > 1) {
country = arr[2]
gsub(/^[ \t]+|[ \t]+$/, "", country)
} else {
country = "Unknown"
}
} else {
country = "조회 실패"
}
close(cmd)
return country
}
{
# Combined log format 예제:
# 127.0.0.1 - - [14/Feb/2025:12:00:00 +0000] "GET / HTTP/1.1" 200 612 "-" "Mozilla/5.0 ..."
regex = "([^ ]*) - ([^ ]*) \\[([^\\]]*)\\] \"([^\"]*)\" ([^ ]*) ([^ ]*) \"([^\"]*)\" \"([^\"]*)\""
if(match($0, regex, arr)) {
ip = arr[1]
referer = arr[7]
ua_str = arr[8]
count[ip]++ # IP별 요청 횟수 집계
ua_stats[ip, ua_str]++ # IP별 User-Agent 빈도 집계
ref_stats[ip, referer]++ # (참고용) 리퍼러 집계
}
}
END {
# gawk의 asorti() 함수로 요청 횟수 기준 내림차순 정렬
n = asorti(count, sorted, "@val_num_desc")
# 헤더 출력 (순서: 순위 | IP | 국가 | Requests | 사용자 종류 | 기타정보)
printf("| %-2s | %-15s | %-18s | %-10s | %-17s | %-21s |\n", "순위", "IP", "국가", "Requests", "사용자 종류", "기타정보")
print("|------|-----------------|----------------------|------------|------------------------|-------------------------|")
limit = (n < 25 ? n : 25)
for(i = 1; i <= limit; i++){
ip = sorted[i]
req_count = count[ip]
# 해당 IP의 가장 많이 등장한 User-Agent 선택
max_ua = ""
max_ua_count = 0
for(key in ua_stats) {
split(key, parts, SUBSEP)
if(parts[1] == ip) {
if(ua_stats[key] > max_ua_count) {
max_ua_count = ua_stats[key]
max_ua = parts[2]
}
}
}
user_type = classify_user_agent(max_ua)
extra = ""
if(user_type == "User") {
# User인 경우: whois 명령으로 Organization Name 조회
cmd = "whois " ip " 2>/dev/null | grep -i -m 1 \"orgname:\""
org = ""
if((cmd | getline org) > 0) {
sub(/^[ \t]+/, "", org)
split(org, a, ":")
if(length(a) > 1) {
org = a[2]
gsub(/^[ \t]+/, "", org)
}
} else {
org = "조회 실패"
}
close(cmd)
extra = org
} else if(user_type == "Bot (Crawler)") {
extra = get_bot_type(max_ua)
} else {
extra = "없음"
}
# 각 IP의 국가 정보 추가
country = get_country(ip)
printf("| %-4d | %-15s | %-20s | %-10d | %-22s | %-25s |\n", i, ip, country, req_count, user_type, extra)
}
}
' "$LOG_FILE"
사용 방법
- 스크립트를 파일에 저장 후 실행 권한 부여:
chmod +x monip.sh - 스크립트 실행 (필요한 경우 sudo로):
sudo ./monip.sh
결과

세상의모든계산기 님의 최근 댓글
3×3 이상인 행렬의 행렬식 determinant https://allcalc.org/50536 2025 12.30 답에 이상한 숫자 14.2857142857가 들어간 것은 조건식에 소숫점(.) 이 들어가 있기 때문에 발생한 현상이구요. 100÷7 = 14.285714285714285714285714285714 소숫점 없이 분수로 식이 주어졌을 때와 결과적으로는 동일합니다. 2025 12.30 그럼 해가 무한히 많은지 아닌지 어떻게 아느냐? 고등학교 수학 교과과정에 나오는 행렬의 판별식(d, determinant)을 이용하면 알 수 있습니다. ㄴ 고교과정에서는 2x2 행렬만 다루던가요? 연립방정식의 계수들로 행렬을 만들고 그 행렬식(determinant)을 계산하여야 합니다. 행렬식이 d≠0 이면 유일한 해가 존재하고, d=0 이면 해가 없거나 무수히 많습니다. * 정상적인 경우 (`2y + 8z = 115`)의 계수 행렬: 1 | 1 1 0 | 2 | 1 0 -3.5 | 3 | 0 2 8 | 행렬식 값 = 1(0 - (-7)) - 1(8 - 0) = 7 - 8 = -1 (0이 아니므로 유일한 해 존재) * 문제가 된 경우 (`2y + 7z = 100`)의 계수 행렬: 1 | 1 1 0 | 2 | 1 0 -3.5 | 3 | 0 2 7 | 행렬식 값 = 1(0 - (-7)) - 1(7 - 0) = 7 - 7 = 0 (0이므로 유일한 해가 존재하지 않음) 2025 12.30 좀 더 수학적으로 말씀드리면 (AI Gemini 참고) 수학적 핵심 원리: 선형 독립성(Linear Independence) 3원 1차 연립방정식에서 미지수 x, y, z에 대한 단 하나의 해(a unique solution)가 존재하기 위한 필수 조건은 주어진 세 개의 방정식이 서로 선형 독립(linearly independent) 관계에 있어야 한다는 것입니다. * 선형 독립 (Linearly Independent): 어떤 방정식도 다른 방정식들의 조합(상수배를 더하거나 빼는 등)으로 만들어질 수 없는 상태입니다. 기하학적으로 이는 3개의 평면(각 방정식은 3D 공간의 평면을 나타냄)이 단 한 개의 점(해)에서 만나는 것을 의미합니다. * 선형 종속 (Linearly Dependent): 하나 이상의 방정식이 다른 방정식들의 조합으로 표현될 수 있는 상태입니다. 이 경우, 새로운 정보를 제공하지 못하는 '잉여' 방정식이 존재하는 것입니다. 기하학적으로 이는 3개의 평면이 하나의 선에서 만나거나(무수히 많은 해), 완전히 겹치거나, 혹은 평행하여 만나지 않는(해가 없음) 상태를 의미합니다. 질문자님의 사례는 '선형 종속'이 되어 무수히 많은 해가 발생하는 경우입니다. 2025 12.30 질문하신 연립 방정식은 미지수가 3개이고 모두 1차인 3원 1차 연립방정식입니다. 이상적으로 문제가 없다면 {x,y,z} 에 대한 좌표가 하나 나오게 됩니다. 원하는 답 {52.5, -2.5, 15} 그런데 두개 조건(식)을 그대로 두고 나머지 하나를 변형하다 보니 원하는 답이 나오지 않는 상황이 발생하였다고 질문하신 상황입니다. 3개의 조건식이 주어진 3원 1차 연립방정식은 조건을 변형해서 하나의 변수를 제거할 수 있습니다. 그러면 2개의 조건식으로 주어지는 2원 1차 연립방정식으로 변형할 수 있습니다. (알아보기 더 쉬워서 변형하는 겁니다) 변경하지 않은 조건의 식(con1) 을 이용해 하나의 y & z 1차 방정식을 유도할 수 있는데요. 나머지 방정식이 con1에서 유도된 방정식과 동일해지면 하나의 답이 구해지지 않는 것입니다. 계산기(ti-nspire)는 {x,y,z} 의 답이 하나가 아니고 무수히 많음을 c1 을 이용해서 표현해 준 것입니다. linear_independence_cond12.tns 2025 12.30