Funções str_extract e str_detect

Funções str_extract e str_detect
Neste artigo, discutiremos as funções str_extract () & str_detect () em r.

Vamos vê -los um por um.

Str_extract ()

A função str_extract () é usada para extrair as strings/números da string fornecida. Isso está disponível no pacote Stringr. Portanto, precisamos carregar a biblioteca Stringr.

Sintaxe:

str_extract ("objeto", "padrão")

Parâmetros:

São necessários dois parâmetros:

  1. objeto refere -se à string ou vetor ou uma lista
  2. O padrão é usado para extrair o tipo de caractere do objeto

Os padrões são:

  1. String - é preciso uma string normal. Se estiver presente no objeto, a string será retornada. Caso contrário, Na é devolvido.
  2. \\ d+ - é usado para verificar o valor numérico presente no objeto. Se estiver presente, retornará esse número. Caso contrário, Na é devolvido. Se houver vários valores numéricos, o primeiro valor numérico será retornado.
  3. [a -z]+ - é usado para verificar o valor da string que está presente no objeto. Se estiver presente, retornará essa string sem espaço. Caso contrário, Na é devolvido. Se houver vários valores de string, o primeiro valor da string será retornado sem espaço.

Exemplo 1:

Neste exemplo, consideraremos uma string e verificaremos um padrão - "Linux".

Biblioteca (Stringr)
#verifique se o String Linux está presente no real ou não
Print (str_extract ("Welcome to Linux Dint 100% Coding", "Linux")))

Resultado:

Podemos encontrar o padrão Linux. Por isso, retorna.

Exemplo 2:

Neste exemplo, consideraremos uma string e verificaremos o padrão numérico - “\\ d+”.

Biblioteca (Stringr)
#verifique o padrão numérico
print (str_extract ("Bem -vindo ao Linux Dint 100% coding", "\\ d+"))

Resultado:

Podemos encontrar o valor numérico 100. Por isso, retorna.

Exemplo 3:

Neste exemplo, consideraremos uma string e verificaremos um padrão de string - “[a -z]+”.

Biblioteca (Stringr)
#verifique o padrão da string
print (str_extract ("Welcome to linux dica 100% coding", "[a-z]+"))

Resultado:

Podemos encontrar o primeiro valor de string não espacial, “Bem -vindo”. Por isso, retorna.

Em um vetor

Agora, aplicamos a função str_extract () em um vetor de três strings.

Exemplo:

Aqui, aplicamos todos os padrões em um vetor chamado Vector_fruits.

Biblioteca (Stringr)
#Crie um vetor com 3 strings
Vector_fruits = C ("Papayya está disponível em 100 Sale", "Water-Lemons", "existem 11 frutas em uma cesta")
#Display o vetor real
Imprimir (Vector_fruits)
Imprima (Colar ("Strings com são:", str_extract (vector_fruits, "são"))))
Imprima (Colar ("Strings com os primeiros alfabetos:", str_extract (vector_fruits "[a-z]+")))))
Imprima (Colar ("Strings com números:", str_extract (vector_fruits, "\\ d+"))))))

Resultado:

Podemos ver que todo elemento de string em um vetor é aplicado com str_extract () e retorna "são" na primeira e última sequência, já que "são" estão presentes. Como "são" não está na segunda sequência, ele retorna a NA.

Em seguida, o padrão -[A-Z]+ Retorna a primeira string das três cordas em um vetor.

Finalmente, o último padrão - retorna os valores numéricos na primeira e na última sequência, já que 100 e 11 estão presentes.

Em uma lista

Agora, aplicamos a função str_extract () em uma lista de três strings.

Exemplo:

Aqui, aplicamos todos os padrões em uma lista chamada list_fruits.

Biblioteca (Stringr)
#Crie uma lista com 3 strings
list_fruits = list ("Papayya está disponível em 100 vendas", "Limões de água", "existem 11 frutas em uma cesta")
#Display a lista real
Print (list_fruits)
Imprima (Colar ("Strings com são:", str_extract (list_fruits, "são"))))
Imprima (Colar ("Strings com os primeiros alfabetos:", str_extract (list_fruits, "[a-z]+")))))
Imprima (Colar ("Strings com números:", str_extract (list_fruits, "\\ d+"))))))))

Resultado:

Podemos ver que todo elemento de sequência de uma lista é aplicado com str_extract () e retorna "são" na primeira e última sequência, já que "são" estão presentes. Como "são" não está presente na segunda sequência, ele retorna a NA.

Em seguida, o padrão -[A-Z]+ Retorna a primeira string das três cordas em uma lista.

Finalmente, o último padrão - retorna os valores numéricos na primeira e na última sequência, já que 100 e 11 estão presentes.

Str_detect ()

Str_detect () está disponível na biblioteca Stringr, que é usada para verificar se a string ou padrão está presente em um objeto. Se existir, retorna ao verdadeiro. Caso contrário, ele retorna ao falso.

Sintaxe:

str_detect (objeto, "string")

Parâmetros:

  1. Objeto refere -se a string/vetor/lista
  2. String representa o padrão para verificar se existe em um objeto ou não

Exemplo 1:

Neste exemplo, consideraremos uma string e verificaremos um padrão - "Linux".

Biblioteca (Stringr)
#verifique se o String Linux está presente no real ou não
Print (STR_DETECT ("Bem -vindo ao Linux Dint 100% Coding", "Linux")))

Resultado:

Podemos encontrar Linux. Por isso, retornou verdadeiro.

Exemplo 2:

Neste exemplo, consideraremos uma string e verificaremos um padrão numérico - “\\ d+”.

Biblioteca (Stringr)
#verifique o padrão numérico
print (str_detect ("Bem -vindo ao Linux Dint 100% coding", "\\ d+"))

Resultado:

Podemos encontrar o valor numérico 100. Portanto, retorna verdadeiro.

Exemplo 3:

Neste exemplo, consideraremos uma string e verificaremos o padrão de string - “[a -z]+”.

Biblioteca (Stringr)
#verifique o padrão da string
print (str_detect ("Bem-vindo ao Linux Dint 100% coding", "[a-z]+"))

Resultado:

Podemos encontrar o primeiro valor de string não espacial "Welcome". Portanto, retorna verdadeiro.

Em um vetor

Agora, aplicamos a função str_detect () em um vetor de três strings.

Exemplo:

Aqui, aplicaremos todos os padrões em um vetor chamado Vector_fruits.

Biblioteca (Stringr)
#Crie um vetor com 3 strings
Vector_fruits = C ("Papayya está disponível em 100 Sale", "Water-Lemons", "existem 11 frutas em uma cesta")
#Display o vetor real
Imprimir (Vector_fruits)
Imprima (Pasta ("Strings com são:", str_detect (vector_fruits, "são"))))
Imprima (Colar ("Strings com os primeiros alfabetos:", str_detect (vector_fruits ", [a-z]+")))))
Imprima (Colar ("Strings com números:", str_detect (vector_fruits, "\\ d+"))))))

Resultado:

Podemos ver que todo elemento de string em um vetor é aplicado com str_detect () e retorna true na primeira e última string, já que "são" estão presentes. Como "são" não está presente na segunda sequência, ele retorna falsa.

Em seguida, o padrão -[A-Z]+ retorna a True de três cordas em um vetor.

Finalmente, o último padrão - retorna os valores numéricos em true, já que 100 e 11 estão presentes na primeira e na última string e retorna false na segunda sequência.

Em uma lista

Agora, aplicaremos a função str_detect () em uma lista de três strings.

Exemplo:

Aqui, aplicamos todos os padrões em uma lista chamada list_fruits.

Biblioteca (Stringr)
#Crie uma lista com 3 strings
list_fruits = C ("Papayya está disponível em 100 vendas", "Limões de água", "existem 11 frutas em uma cesta")
#Display a lista real
Print (list_fruits)
Imprima (Colar ("Strings com são:", str_detect (list_fruits, "são"))))
Imprima (Colar ("Strings com os primeiros alfabetos:", str_detect (list_fruits "[a-z]+")))))
Imprima (Colar ("Strings com números:", str_detect (list_fruits, "\\ d+")))))))

Resultado:

Podemos ver que todo elemento de sequência de uma lista é aplicado com str_detect () e retorna true na primeira e última sequência, já que "Are" está presente. Como "são" não está presente na segunda sequência, ele retorna falsa.

Em seguida, o padrão -[A-Z]+ retorna ao TRUE de três cordas em uma lista.

Finalmente, o último padrão - retorna os valores numéricos em true, já que 100 e 11 estão presentes na primeira e na última string e retorna false na segunda sequência.

Conclusão

Neste artigo, vimos as funções str_extract () e str_detect () em r e como aplicar essas funções no vetor e na lista. Str_detect () é usado para verificar se o padrão está presente no objeto especificado. Se sim, ele retornará ao verdadeiro. Caso contrário, ele retorna ao falso. O str_extract () é usado para verificar se o padrão está presente no objeto especificado. Se sim, ele retorna o padrão. Caso contrário, Na é devolvido.