Split два разделителя python

Строковые методы split() и join() в Python

При работе со строками в Python вам может потребоваться разбить строку на подстроки или, наоборот, объединить несколько мелких кусочков в одну большую строку. В этой статье мы рассмотрим методы split() и join(), которые как раз и используются для разделения и объединения строк. Мы на примерах разберем, как они помогают легко выполнять необходимые нам задачи.

Важно отметить, что поскольку строки в Python неизменяемы, вы можете вызывать для них методы, не изменяя исходные строки. Итак, давайте начнем!

Метод split()

Когда вам нужно разбить строку на подстроки, вы можете использовать метод split().

Метод split() принимает строку и возвращает список подстрок. Синтаксис данного метода выглядит следующим образом:

Здесь – любая допустимая строка в Python, а sep – это разделитель, по которому вы хотите разделить исходную строку. Его следует указывать в виде строки.

Например, если вы хотите разделить по запятым, нужно установить sep = «,» .

sep – необязательный аргумент. По умолчанию метод split() разбивает строки по пробелам.

maxsplit – еще один опциональный аргумент, указывающий, сколько раз вы хотите разделить исходную строку . По умолчанию maxsplit имеет значение -1. При таком значении метод разбивает строку по всем вхождениям параметра sep.

Читайте также:  About html 0 margin

Если вы хотите разделить исходную строку на две части, по первому вхождению запятой, вы можете установить maxsplit = 1 . Так вы получите две подстроки: части исходной строки до и после первой запятой.

Таким образом, при одном разрезе строки вы получаете 2 подстроки. При двух разрезах — 3 подстроки. то есть, разрезая строку k раз, вы получите k+1 фрагментов.

Давайте рассмотрим несколько примеров, чтобы увидеть метод split() в действии.

Примеры использования метода split() в Python

Зададим строку my_string , как это показанного ниже. После этого вызовем метод split() для my_string без аргументов sep и maxsplit .

my_string = "I code for 2 hours everyday" my_string.split() # ['I', 'code', 'for', '2', 'hours', 'everyday']

Вы можете видеть, что my_string разделена по всем пробелам. Метод возвращает список подстрок.

Рассмотрим следующий пример. Здесь my_string содержит названия фруктов, разделенные запятыми.

Давайте разделим my_string по запятым. Для этого нужно установить sep = «,» или просто передать в метод «,» при вызове.

my_string = "Apples,Oranges,Pears,Bananas,Berries" my_string.split(",") # ['Apples', 'Oranges', 'Pears', 'Bananas', 'Berries']

Как и ожидалось, метод split() вернул список фруктов, где каждый фрукт из my_string стал элементом списка.

Теперь давайте воспользуемся необязательным аргументом maxsplit и установив его равным 2.

my_string.split(",", 2) # ['Apples', 'Oranges', 'Pears,Bananas,Berries']

Попробуем разобрать получившийся список.

Напомним, что my_string = «Apples,Oranges,Pears,Bananas,Berries» , и мы решили разделить эту строку по запятым «,» .

Первая запятая стоит после Apples , и после первого разделения у нас будет две подстроки: Apples и Oranges,Pears,Bananas,Berries .

Вторая запятая стоит после Oranges . Таким образом, после второго деления у нас будет уже три подстроки: Apples , Oranges и Pears,Bananas,Berries .

Сделав два разреза строки, мы достигли установленного максимума, и дальнейшее деление невозможно. Поэтому часть строки после второй запятой объединяется в один элемент в возвращаемом списке.

Надеюсь, теперь вы понимаете, как работает метод split() и для чего нужны аргументы sep и maxsplit .

Метод join()

Теперь, когда вы знаете, как разбить строку на подстроки, пора научиться использовать метод join() для формирования строки из подстрок.

Синтаксис метода Python join() следующий:

Здесь – любой итерируемый объект Python, содержащий подстроки. Это может быть, например, список или кортеж. – это разделитель, с помощью которого вы хотите объединить подстроки.

По сути, метод join() объединяет все элементы в , используя в качестве разделителя.

Примеры использования метода join() в Python

В предыдущем разделе мы разбивали строку my_string по запятым и получали в итоге список подстрок. Назовем этот список my_list .

Теперь давайте сформируем строку, объединив элементы этого списка при помощи метода join(). Все элементы в my_list – это названия фруктов.

my_list = my_string.split(",") # после разделения my_string мы получаем my_list: # ['Apples', 'Oranges', 'Pears', 'Bananas', 'Berries']

Обратите внимание, что разделитель для присоединения должен быть указан именно в виде строки. В противном случае вы столкнетесь с синтаксическими ошибками.

Чтобы объединить элементы в my_list с использованием запятой в качестве разделителя, используйте «,» а не просто , . Это показано во фрагменте кода ниже.

", ".join(my_list) # Output: Apples, Oranges, Pears, Bananas, Berries

Здесь элементы my_list объединяются в одну строку с помощью запятых, за которыми следуют пробелы.

Разделитель может быть любым.

Давайте для примера используем в качестве разделителя 3 символа подчеркивания ___ .

"___".join(my_list) # Output: Apples___Oranges___Pears___Bananas___Berries

Элементы в my_list теперь объединены в одну строку и отделены друг от друга тремя подчеркиваниями ___ .

Теперь вы знаете, как сформировать одну строку из нескольких подстрок с помощью метода join().

Заключение

Итак, мы рассмотрели строковые методы split() и join(). Из этой статьи вы узнали следующее:

  • .split (sep, maxsplit) разбивает исходную строку по вхождениям разделителя sep , maxsplit раз.
  • .join() объединяет подстроки в итерируемый объект , используя в качестве разделителя.

Надеюсь, вам была полезна данная статья. Успехов в написании кода!

Более 50 задач на строки в нашем телеграм канале Python Turbo. Уютное сообщество Python разработчиков.

Источник

Python: Split a String on Multiple Delimiters

Python Split a String on Multiple Delimiters Cover Image

In this tutorial, you’ll learn how to use Python to split a string on multiple delimiters. You’ll learn how to do this with the built-in regular expressions library re as well as with the built-in string .split() method.

But why even learn how to split data? Splitting data can be an immensely useful skill to learn. Data comes in all shapes and it’s often not as clean as we would like to be. There will be many times when you want to split a string by multiple delimiters to make it more easy to work with.

How do you split a string in Python?

Python has a built-in method you can apply to string, called .split() , which allows you to split a string by a certain delimiter.

The method looks like this:

string.split(separator, maxsplit)
  • separator: argument accepts what character to split on. If no argument is provided, it uses any whitespace to split.
  • maxsplit: the number of splits to do, where the default value is -1 , meaning that all occurrences are split.

Let’s say you had a string that you wanted to split by commas – let’s learn how to do this:

sample_string = 'my name is nik, welcome to datagy' split_string = sample_string.split(',') print(split_string) # Returns: ['my name is nik', ' welcome to datagy']

We can see here that what’s returned is a list that contains all of the newly split values.

Split a Python String on Multiple Delimiters using Regular Expressions

The most intuitive way to split a string is to use the built-in regular expression library re . The library has a built in .split() method, similar to the example covered above. What’s unique about this method is that it allows you to use regular expressions to split our strings.

Let’s see what this method looks like:

re.split(pattern, string, maxsplit=0, flags=0)

Similar to the example above, the maxsplit= argument allows us to set how often a string should be split. If it’s set to any positive non-zero number, it’ll split only that number of times.

So, let’s repeat our earlier example with the re module:

import re sample_string = 'my name is nik, welcome to datagy' split_string = re.split(',', sample_string) print(split_string) # Returns: ['my name is nik', ' welcome to datagy']

Now, say you have a string with multiple delimiters. The re method makes it easy to split this string too!

Let’s take a look at another example:

import re sample_string = 'hi! my name is nik, welcome; to datagy' split_string = re.split(r',|!|;', sample_string) print(split_string) # Returns: ['hi', ' my name is nik', ' welcome', ' to datagy']

What we’ve done here is passed in a raw string that re helps interpret. We pass in the pipe character | as an or statement.

We can simplify this even further by passing in a regular expressions collection. Let’s see how we can do this:

import re sample_string = 'hi! my name is nik, welcome; to datagy' split_string = re.split(r'[,;!]', sample_string) print(split_string) # Returns: ['hi', ' my name is nik', ' welcome', ' to datagy']

This returns the same thing as before, but it’s a bit cleaner to write and to read.

Split a Python String on Multiple Delimiters using String Split

You’re also able to avoid use of the re module altogether. The module can be a little intimidating, so if you’re more comfortable, you can accomplish this without the module as well.

In the example below, you’ll learn how to split a Python string with multiple delimiters by first replacing values. We’ll take our new string and replace all delimiters to be one consistent delimiter. Let’s take a look:

sample_string = 'hi! my name is nik, welcome; to datagy' new_string = sample_string.replace('!', ',').replace(';', ',') split_string = new_string.split(',') print(split_string) # Returns: ['hi', ' my name is nik', ' welcome', ' to datagy']

This method works fine when you have a small number of delimiters, but it quickly becomes messy when you have more than 2 or 3 delimiters that you would want to split your string by. It’s better to stick to the re module for more complex splits.

Create a Function to Split a Python String with Multiple Delimiters

Finally, let’s take a look at how to split a string using a function. For this function, we’ll use the re module. You’ll be able to pass in a list of delimiters and a string and have a split string returned.

from re import split def split_string(string, delimiters): """Splits a string by a list of delimiters. Args: string (str): string to be split delimiters (list): list of delimiters Returns: list: list of split strings """ pattern = r'|'.join(delimiters) return split(pattern, string) sample_string = 'hi! my name is nik, welcome; to datagy' new_string = split_string(sample_string, [',',';','!']) print(new_string) # Returns: ['hi', ' my name is nik', ' welcome', ' to datagy']

Conclusion

In this post, you learned how to split a Python string by multiple delimiters. You learned how to do this using the built-in .split() method, as well as the built-in regular expression re ‘s .split() function.

To learn more about splitting Python strings, check out the .split() method’s documentation here. To learn more about splitting strings with re , check out the official documentation here.

Источник

Оцените статью