Uniq по двум столбцам с двумя условиями

у меня есть таблица со столбцами. В первом столбце у меня есть время, когда пользователь вошел в систему, во втором столбце у меня есть имя пользователя.

13:15:39  fxs1cia1qulm1lk  
13:15:39  fxs1cia1qulm1lk  
13:15:39  fxs1cia1qulm1lk  
13:15:42  faaaa2aa11111  
13:15:49  terd1sfsd11fsdf  
13:15:49  terd1sfsd11fsdf  
13:15:49  terd1sfsd11fsdf  
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:15:59  21erdsf123sdfsdf   
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab  
13:17:50  abcasbbabadab   
13:19:19  fxs1ce1iulmla   
13:19:19  fxs1ce1iulmla  
13:19:19  fxs1ce1iulmla   
13:20:42  faaa2a0a1111

Итак, что мне делать. Я должен сделать одно и то же с этими двумя столбцами, Andm, если время входа пользователя и имя пользователя совпадают, я должен сказать, Я написал короткий скрипт:

log_file=/root/log
temp_file=/root/temp
temp_file2=/root/temp2

cat /dev/null > $temp_file
cat /dev/null > $temp_file2
cat /dev/null > $result_file

cat $log_file | awk '{print $1}' | tail -n 20 > $temp_file
cat $log_file | awk '{print $5}' | tail -n 20 > $temp_file2

for i in `uniq -c $temp_file | awk '{print $1}'`; do
for y in `uniq -c $temp_file2 | awk '{print $2}'`; do
if [ $i -gt 3 ] && [ $y -gt 3 ]; then
s=`uniq -c $temp_file2 | awk '$1 == '$i`
echo "The user $s has logged more than 3 times"
fi
done
done

Пожалуйста, проверьте, как вы думаете, этот скрипт правильный? Потому что, после вывода моего скрипта в эхо, у меня есть это:

The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times
The user       4 21erdsf123sdfsdf   
      4 abcasbbabadab  has logged more than 3 times

Но я хочу получить такой вывод:

The user       4 21erdsf123sdfsdf has logged more than 3 times
The user       4 abcasbbabadab  has logged more than 3 times

И все. Где у меня ошибка? Пожалуйста, помогите.

-1
задан 20 January 2017 в 21:21
2 ответа

Вы можете сделать это очень просто с помощью awk

awk '{ users[$2]++ }
END {
     for (user in users)
       if (users[user] > 1)
         printf "%s logged in %d times\n", user, users[user]
    }' < /root.log

Эта программа сканирует root.log, создавая ассоциативный массив (также известный как хэш) со счетчиками каждого пользователя, а затем печатает те, которые больше единицы.

3
ответ дан 5 December 2019 в 19:02

Итак, единственная проблема в том, что один и тот же вывод печатается несколько раз? Почему бы просто не пропустить через uniq? Сделать дамп в другой временный файл, а затем запустить для него uniq?

Если это не то, о чем вы спрашиваете, у меня есть некоторые наблюдения:

  • работа с данными, разделенными строками в bash / sh, обычно вызывает больше проблем, чем того стоит. Если решение не является очевидным, выберите язык сценариев, на котором вам не придется постоянно возиться с IFS. (Если вы не знаете, что такое IFS var, то я действительно рекомендую держаться подальше от bash / sh для данных, разделенных строками.)
  • , поскольку вы уже используете awk, держу пари, вы могли бы сделать все это как сценарий awk.
  • Поскольку строки, которые вас интересуют, идентичны, вы можете выполнить sort logfile | uniq -c .
  • Вы не сортируете файл до uniq, поэтому uniq не будет работать, если одинаковые строки не находятся рядом друг с другом. Например, если Боб и Джо входят в систему одновременно и их записи в журнале чередуются.
  • всегда есть grep -c
  • , чтобы прочитать команду сортировки, особенно -d, -n, -k и -t

ОБНОВЛЕНИЕ

Вы просите совета по написанию сценариев оболочки или ищете практический ответ на вопрос о том, как узнать, кто в настоящее время вошел в 3 или более сеансов?

совет по сценариям :

  • Я почти уверен, что $ s содержит всю строку 4 21erdsf123sdfsdf 4 abcasbbabadab , включая новую строку. Я не могу понять почему.
  • Почему вы делаете awk '{print $ 5}' ? Я попытался скопировать данные из вашего примера и запустить его через awk '{print $ 5}' , и у меня появилось несколько символов новой строки и ничего больше.
  • Вы смотрели содержимое $ temp_file и $ temp_file2 , чтобы убедиться, что они соответствуют вашим ожиданиям?
  • tail -n 20 сообщает мне, что вам нужны только «недавние» записи, и вам все равно как недавно. Это правда?
  • Строки cat / dev / null> $ file избыточны, просто удалите их.
  • Замените cat $ logfile на sort $ logfile
  • Отступы в циклах

В основном этот сценарий не будет делать то, что вы хотите, и я не могу сказать, как вы намеревались его работать, поэтому я не могу дать более конкретных советов. Извините.

Практически

  • используйте awk-скрипт @ greg-tarsa ​​('pologies to' e, Грег меня сердечно,Я знаю, что знает ссылку, а не имя пользователя, в котором есть пробел)
  • Вы говорите о текущих логинах в Unix? Вы пробовали команду who ? EG кто | awk '{print $ 1}' | сортировать | uniq -c | sort -d -r или команда last ?
  • поиск ответа на ваш общий вопрос (как мне узнать, кто входил / заходил в систему слишком много раз), а не больше конкретный вопрос, который блокирует решение, которое вы уже пытаетесь реализовать (Uniq по двум столбцам с двумя условиями). Если вам больше интересно попрактиковаться в написании сценариев оболочки, задайте свой вопрос так, чтобы он гласил:
2
ответ дан 5 December 2019 в 19:02

Теги

Похожие вопросы